So sánh bốn phương pháp chủ quan trong đánh giá chất lượng hình ảnh

Computer Graphics Forum - Tập 31 Số 8 - Trang 2478-2491 - 2012
Rafał Mantiuk1, Anna Lewandowska2, Radosław Mantiuk2
1Bangor University, United Kingdom [email protected]
2West Pomeranian Univ. of Technology in Szczecin (Poland)

Tóm tắt

Tóm tắtĐể cung cấp bằng chứng thuyết phục rằng một phương pháp mới tốt hơn công nghệ hiện tại, các dự án đồ họa máy tính thường đi kèm với các nghiên cứu người dùng, trong đó một nhóm quan sát viên xếp hạng hoặc đánh giá kết quả của một số thuật toán. Các nghiên cứu người dùng như vậy, được biết đến với tên gọi là thí nghiệm đánh giá chất lượng hình ảnh chủ quan, có thể rất tốn thời gian và không đảm bảo cho kết quả cuối cùng. Bài báo này nhằm hỗ trợ thiết kế các thí nghiệm đánh giá chất lượng hiệu quả và chặt chẽ, đồng thời nhấn mạnh các khía cạnh chính của việc phân tích kết quả. Để thúc đẩy tiêu chuẩn phân tích dữ liệu tốt, chúng tôi xem xét các phương pháp chính cho phân tích dữ liệu, như thiết lập khoảng tin cậy, kiểm tra thống kê và phân tích sức mạnh hồi cứu. Hai phương pháp hình ảnh hóa kết quả xếp hạng cùng với thông tin có ý nghĩa về ý nghĩa thống kê và thực tiễn được khám phá. Cuối cùng, chúng tôi so sánh bốn phương pháp đánh giá chất lượng chủ quan nổi bật nhất: kích thích đơn, kích thích đôi, so sánh cặp bắt buộc và phán đoán độ tương đồng. Chúng tôi kết luận rằng phương pháp so sánh cặp bắt buộc dẫn đến độ sai lệch đo lường nhỏ nhất và do đó sản xuất ra kết quả chính xác nhất. Phương pháp này cũng là phương pháp tiết kiệm thời gian nhất, giả định số điều kiện được so sánh ở mức độ vừa phải.

Từ khóa

#Đánh giá chất lượng hình ảnh #phương pháp chủ quan #phân tích thống kê #phân tích dữ liệu #so sánh cặp bắt buộc

Tài liệu tham khảo

10.1201/b11308

De RidderH. MajoorG.:Numerical category scaling: An efficient method for assessing digital image coding impairments. InProceedings of SPIE( San Jose CA USA 1990) vol.1249 p.65.

Engeldrum P., 2000, Psychometric Scaling: A Toolkit for Imaging Systems Development

Ferwerda J. A.:Psychophysics 101: How to run perception experiments in computer graphics. InProceedings of ACM SIGGRAPH 2008 Classes( Los Angeles CA USA 2008) ACM pp.1–60.

10.1007/BF02289713

Howell D. C., 2007, Statistical Methods for Psychology

ITU‐R.Rec.BT.500‐11:Methodology for the subjective assessment of the quality for television pictures 2002.

ITU‐T.Rec.P.910:Subjective audiovisual quality assessment methods for multimedia applications 2008.

KeelanB. W.:ISO 20462: A psychophysical image quality measurement standard. InProceedings of the SPIE( San Jose CA USA 2003) vol.5294 pp.181–189.

10.1145/1073204.1073242

10.1111/j.1467-8659.2009.01358.x

PellaciniF. FerwerdaJ. A. GreenbergD. P.:Toward a psychophysically‐based light reflection model for image synthesis.Proceedings of SIGGRAPH( New Orleans LA USA 2000) vol.2000 pp.55–64.

10.1561/0600000037

Ponomarenko N., 2009, TID2008—A database for evaluation of full‐reference visual quality assessment metrics, Advances of Modern Radioelectronics 10, 30

Rubinstein M., 2010, A comparative study of image retargeting, ACM Transactions on Graphics 29, 160

RediJ. LiuH. AlersH. ZuninoR. HeynderickxI.:Comparing subjective image quality measurement methods for the creation of public databases. InProceedings of the SPIE( San Jose CA USA 2010) vol.7529 pp.752903‐1–752903‐11.

10.1117/1.1344187

Sheikh H., 2006, A statistical evaluation of recent full reference image quality assessment algorithms, IEEE Transactions on Image Processing 15, 3441

SundstedtV. WhittonM. BlojM.:The whys how tos and pitfals of user studies. InProceedings of ACM SIGGRAPH 2009 Courses( New Orleans LA USA 2009).

TominagaT. HayashiT. OkamotoJ. TakahashiA.:Performance comparisons of subjective quality assessment methods for mobile video. InProceedings of the International Workshop on Quality of Multimedia Experience (QoMEX)( Trondheim Norway 2010) pp.82–87.

Torgerson W. S., 1985, Theory and Methods of Scaling

Van DijkA. M. MartensJ. B. WatsonA. B.:Quality assessment of coded images using numerical category scaling. InProceedings of the SPIE( San Jose CA USA 1995) vol.2451 pp.90–101.

ČAdík M., 2008, Evaluation of HDR tone mapping methods using essential perceptual attributes, Computers & Graphics 32, 330, 10.1016/j.cag.2008.04.003

10.2200/S00010ED1V01Y200508IVM003

Winkler S.:On the properties of subjective ratings in video quality experiments. InProceedings of the 1st International Workshop on Quality of Multimedia Experience (QoMEX)( San Diego CA USA 2009) pp.139–144.

10.1111/j.1467-8659.2006.00961.x