Bước tiến mới của 4K

05/12/2016Gốc

Trên thị trường đã xuất hiện nhiều TV và nội dung video 4K, nhưng thứ chúng ta chiêm ngưỡng có thực sự là 4K hay không?

TV 3D không chinh phục được người xem vì nó còn quá thô sơ, khó chịu đối với hầu hết chúng ta. Nhưng 4K lại khác, và thị trường này đang rất sôi động. 4K có độ phân giải cao gấp 4 lần so với chuẩn HD, cũng như có dải màu rộng hơn, sắc đen trắng sâu hơn nhờ vào công nghệ dải động HDR. Đó là những gì hiển hiện trước mắt người dùng khi nhìn vào những thước phim 4K. Các nhà sản xuất TV đến nay đã bán được hơn 8 triệu chiếc TV 4K.

Nhưng liệu người xem có thực sự xem đúng nội dung 4K hay không? Trong đa số trường hợp, câu trả lời là không. Các hãng sản xuất nội dung hầu như chưa đưa ra được dịch vụ 4K, còn số nhà đài và dịch vụ có hỗ trợ 4K hiện tại chỉ đếm được trên đầu ngón tay. Phần lớn người xem chỉ có được nội dung 1080p được nội suy lên độ phân giải cao hơn dành cho TV 4K. Một khó khăn lớn với dịch vụ streaming video còn là đường truyền dành cho 4K. Ngay tại Mỹ, băng thông trung bình chỉ đạt 15,3 Mbps, đủ mức tối thiểu để truyền 4K trực tiếp. Dù vậy, Netflix đề nghị cần có băng thông 25Mbps.

Rõ ràng, băng thông càng ngày càng lớn hơn, theo sự tiến bộ hàng ngày của công nghệ. Nhưng hiện thời, những giải pháp về nội dung cho 4K còn rất hạn chế. Hiện chỉ có hai công ty thực sự mang đến nội dung 4K cho người dùng.

Beamr

Beamr giảm kích thước hình ảnh xuống bằng cách chia mỗi khung hình (frame) thành từng khối (block), đo đạc lại chất lượng hình ảnh của từng khối, sau đó giảm kích thước khối xuống càng nhỏ càng tốt mà không thay đổi chất lượng. Đây là kỹ thuật từng áp dụng rộng rãi từ thời ảnh JPEG cho đến nay là video UHD, nghĩa là tính toán mức chất lượng dựa trên khả năng cảm thụ hình ảnh của con người, sau đó tối ưu hình ảnh. Điều này giúp giảm được kích thước của file mà ảnh xuất vẫn không thay đổi trong mắt người xem. Phần mềm của Beamr kiểm tra các thành phần như vân phủ (texture), độ chuyển màu (gradient) và biên của đối tượng khi tính toán chất lượng ảnh dựa trên mắt người.

Đối với video 4K, Beamr tạo ra bộ codec HEVC tối ưu của riêng họ. HEVC là một trong những codec video quan trọng trên thị trường, được sử dụng để giảm kích thước file nhưng vẫn giữ được chất lượng hình ảnh.

Theo Mark Donnigan, phó chủ tịch mảng tiếp thị của Beamr, cho rằng bí quyết của họ là họ phát triển được một phương pháp định lượng chất lượng hình ảnh tốt, để từ đó làm căn cứ cho quy trình thu nhỏ hình ảnh theo từng khung hình một, giúp bộ mã hóa (encoder) hình ảnh đạt được mức bit rate thấp nhất trước khi hình ảnh bị sai lệch (artifact). Artifact là lỗi phổ biến về hình ảnh trong tiến trình encode video, trong đó artifact phổ biến nhất là các khối điểm ảnh giống nhau mà ứng dụng trình chiếu video hiển thị khi ứng dụng có quá ít thông tin về các khối ấy sẽ hiển thị như thế nào. Phần mềm của Beamr mã hóa một khung hình, đo lại chất lượng hình ảnh, rồi mã hóa lại nếu phát hiện có artifact. Trung bình mỗi khung hình mất 1,5 lần mã hóa.

Trong ngành, Beamr được xem là công ty tiên phong trong mã hóa video mà không đánh đồng chất lượng của từng khung hình để đưa ra tỉ lệ nén hình ở mức tối ưu. Các giải pháp như của Beamr, dựa trên thể loại video để đưa ra mức nén, gọi là giải pháp dựa trên nội dung. Tháng 12/2015, Netflix cũng đã công bố họ đã encode lại toàn bộ thư viện video của họ với cách tiếp cận dựa trên từng thể loại phim, không như trước đây là áp dụng một tỉ lệ nén cho tất cả phim.

Thách thức của ngành công nghiệp video hiện nay là khi nói đến một file video 4K, ví dụ như một bộ phim hành động, thì để truyền video ấy đến được từng hộ gia đình thì cần hạ tầng băng thông đủ lớn, mà hiện nay hạ tầng ấy vượt quá khả năng của hầu hết gia đình. Còn đối với những phim ít có cảnh chuyển động, khả năng tối ưu HEVC dựa trên nội dung của Beamr có thể nén video 4K xuống còn 10Mbps, còn đối với phim hành động thì chuẩn này vẫn cần đường truyền đến 25Mbps. Những công ty như Netflix, Dolby, Dalet, Sony hay IBM đều dựa trên các công cụ mã hóa và tối ưu video của Beamr.

Phương pháp của Beamr: một cách để truyền video 4K là chia các khung hình thành từng block, sau đó giảm kích thước của mỗi block trong khi vẫn duy trì được chất lượng ảnh.

V-Nova

V-Nova có gốc tại London, là một công ty mới gia nhập thị trường nén video, với bộ mã hóa Perseus riêng, xuất hiện trên thị trường từ tháng 4/2015. Công ty này cũng đưa ra một giải pháp nén video độc đáo.

Hầu hết các giải pháp nén video hiện thời (có cả Beamr) đều chia mỗi khung hình thành từng block, sau đó giảm lượng thông tin trên mỗi block. Còn Perseus làm ngược lại, đầu tiên, bộ codec này tạo ra hình ảnh ở kích thước nhỏ nhất cho mỗi khung hình, sau đó thêm vào chi tiết để tạo ra các phiên bản độ phân giải cao hơn. Cách làm này dựa trên một công nghệ có tên gọi là adaptive streaming, và ứng dụng trình chiếu và đường truyền sẽ quyết định xem nên sử dụng phiên bản độ phân giải nào ngay tại thời điểm ấy. Bởi vì khung hình không bị chia nhỏ thành từng block nên không có hiện tượng artifact ở mỗi block xuất hiện. Video kích thước nhỏ với độ phân giải thấp sẽ trông mềm mại hơn, ít chi tiết hơn nhưng không bị hiện tượng nhiễu theo block như các giải pháp nén truyền thống gặp phải.

Fabio Murra, phó chủ tịch về sản phẩm và tiếp thị của V-Nova, cho biết: "Perseus là cách tiếp cận nén video rất khác biệt. Nó thực sự viết lại cách mà chúng ta can thiệp vào dữ liệu video nói chung."

Cách làm của V-Nova cũng đã tạo được tiếng vang trên thị trường nén video. Công ty rất thành công khi nén được video 4K xuống còn 6Mbps để có thể truyền được qua mạng di động, và thậm chí có thể làm được video 4K chỉ ở 4Mbps.

Những thử nghiệm ban đầu cho thấy V-Nova đã tạo được kích thước file nhỏ hơn đáng kể so với giải pháp của các đối thủ cạnh tranh, trong khi vẫn có được chất lượng hình ảnh xuất sắc. Đó là lý do tại sao thành viên mới gia nhập thị trường này đã "lấy lòng" được một số khách hàng lớn, trong đó có hãng truyền thông vệ tinh Pháp Eutelsat và nền tảng TV vệ tinh Sky Italia.

Tuy vậy, quy trình của V-Nova lại khiến giới chuyên môn hoài nghi: khi nào một hình ảnh 4K không còn là ảnh 4K nữa? Perseus tạo ra các file cực nhỏ với độ phân giải 4K, nhưng những video là chuỗi kết hợp những file ấy có đủ độ chi tiết mà người xem mong đợi ở một video UHD (ultra-high definition) thực thụ hay không? Murra cho rằng tùy vào khách hàng quyết định xem họ có chấp nhận chất lượng như vậy hay không.

Cách mà thuật toán của V-Nova hoạt động là nó bắt đầu với những phiên bản hình ảnh nhỏ, sau đó dần dần tạo những phiên bản lớn hơn, thêm chi tiết cho hình ảnh. V-Nova luôn luôn có thể tạo được video ở độ phân giải 4K. Ngay cả khi bạn đưa cho thuật toán này video 1MB thì Perseus có thể tạo ra được video 4K, nhưng kết quả cuối cùng còn tùy thuộc vào quyết định của bạn xem liệu video 4K kiểu "nội suy" ấy có chấp nhận được hay không.

Nội suy hình ảnh chính xác là thứ mà các nhà cung cấp dịch vụ truyền thông cần có, khi lượng truyền video trên mạng ngày càng cao theo thời gian. Có lẽ giải pháp của V-Nova sẽ giúp người dùng chúng ta có được nội dung UHD không giới hạn mà không phải lệ thuộc quá nhiều vào băng thông internet của nhà mạng như hiện nay. Và khi điều đó xảy ra, chúng ta sẽ biết thế nào là TV 4K, thị trường 4K sẽ trở nên sôi động hơn bao giờ hết.

PC World VN 11/2016

Đồng Anh

Nguồn PC World: http://pcworld.com.vn/articles/cong-nghe/cong-nghe/2016/12/1250356/buoc-tien-moi-cua-4k/