[FFmpeg-devel] [PATCH v4 3/3] swscale/aarch64: Add argb/abgr to yuv
Martin Storsjö
martin at martin.st
Mon Jun 24 16:10:55 EEST 2024
On Mon, 24 Jun 2024, Zhao Zhili wrote:
> From: Zhao Zhili <zhilizhao at tencent.com>
>
> Test on Apple M1 with kperf:
> : -O3 : -O3 -fno-vectorize
> abgr_to_uv_8_c : 19.4 : 26.1
> abgr_to_uv_8_neon : 29.9 : 51.1
> abgr_to_uv_128_c : 146.4 : 558.9
> abgr_to_uv_128_neon : 85.1 : 83.4
> abgr_to_uv_1080_c : 1162.6 : 4786.4
> abgr_to_uv_1080_neon : 819.6 : 826.6
> abgr_to_uv_1920_c : 2063.6 : 8492.1
> abgr_to_uv_1920_neon : 1435.1 : 1447.1
> abgr_to_uv_half_8_c : 16.4 : 11.4
> abgr_to_uv_half_8_neon : 35.6 : 20.4
> abgr_to_uv_half_128_c : 108.6 : 359.4
> abgr_to_uv_half_128_neon : 75.4 : 42.6
> abgr_to_uv_half_1080_c : 883.4 : 2885.6
> abgr_to_uv_half_1080_neon : 460.6 : 481.1
> abgr_to_uv_half_1920_c : 1553.6 : 5106.9
> abgr_to_uv_half_1920_neon : 817.6 : 820.4
> abgr_to_y_8_c : 6.1 : 26.4
> abgr_to_y_8_neon : 40.6 : 6.4
> abgr_to_y_128_c : 99.9 : 390.1
> abgr_to_y_128_neon : 67.4 : 55.9
> abgr_to_y_1080_c : 735.9 : 3170.4
> abgr_to_y_1080_neon : 534.6 : 536.6
> abgr_to_y_1920_c : 1279.4 : 6016.4
> abgr_to_y_1920_neon : 932.6 : 927.6
> ---
> libswscale/aarch64/input.S | 86 +++++++++++++++++++++++++++---------
> libswscale/aarch64/swscale.c | 17 +++++++
> 2 files changed, 82 insertions(+), 21 deletions(-)
This patchset looks ok to me (but wait a little bit in case someone else
has further opinions on it).
// Martin
More information about the ffmpeg-devel
mailing list