[FFmpeg-devel] [PATCH v4 3/3] swscale/aarch64: Add argb/abgr to yuv

Martin Storsjö martin at martin.st
Mon Jun 24 16:10:55 EEST 2024


On Mon, 24 Jun 2024, Zhao Zhili wrote:

> From: Zhao Zhili <zhilizhao at tencent.com>
>
> Test on Apple M1 with kperf:
> 				: -O3		: -O3 -fno-vectorize
> abgr_to_uv_8_c			: 19.4		: 26.1
> abgr_to_uv_8_neon		: 29.9		: 51.1
> abgr_to_uv_128_c		: 146.4		: 558.9
> abgr_to_uv_128_neon		: 85.1		: 83.4
> abgr_to_uv_1080_c		: 1162.6	: 4786.4
> abgr_to_uv_1080_neon		: 819.6		: 826.6
> abgr_to_uv_1920_c		: 2063.6	: 8492.1
> abgr_to_uv_1920_neon		: 1435.1	: 1447.1
> abgr_to_uv_half_8_c		: 16.4		: 11.4
> abgr_to_uv_half_8_neon		: 35.6		: 20.4
> abgr_to_uv_half_128_c		: 108.6		: 359.4
> abgr_to_uv_half_128_neon	: 75.4		: 42.6
> abgr_to_uv_half_1080_c		: 883.4		: 2885.6
> abgr_to_uv_half_1080_neon	: 460.6		: 481.1
> abgr_to_uv_half_1920_c		: 1553.6	: 5106.9
> abgr_to_uv_half_1920_neon	: 817.6		: 820.4
> abgr_to_y_8_c			: 6.1		: 26.4
> abgr_to_y_8_neon		: 40.6		: 6.4
> abgr_to_y_128_c			: 99.9		: 390.1
> abgr_to_y_128_neon		: 67.4		: 55.9
> abgr_to_y_1080_c		: 735.9		: 3170.4
> abgr_to_y_1080_neon		: 534.6		: 536.6
> abgr_to_y_1920_c		: 1279.4	: 6016.4
> abgr_to_y_1920_neon		: 932.6		: 927.6
> ---
> libswscale/aarch64/input.S   | 86 +++++++++++++++++++++++++++---------
> libswscale/aarch64/swscale.c | 17 +++++++
> 2 files changed, 82 insertions(+), 21 deletions(-)

This patchset looks ok to me (but wait a little bit in case someone else 
has further opinions on it).

// Martin



More information about the ffmpeg-devel mailing list