48110000000次播放!背后是……

導讀28天,64場比賽,聯結著不同地域、不同膚色、不同時區的50億心跳。球場上,助攻、傳射、絕殺,反轉不斷。手機前,科技觀賽、云上侃球,令人...

28天,64場比賽,聯結著不同地域、不同膚色、不同時區的50億心跳。

球場上,助攻、傳射、絕殺,反轉不斷。手機前,科技觀賽、云上侃球,令人耳目一新。這屆世界杯,視頻云技術改變了觀賽生態,通過切入物理空間的深層肌理,在線上搭建起“全民參與”的場域,在抖音觀看世界杯,成為不少球迷首選。

“單場觀眾人數峰值達1.6億(阿根廷vs沙特),實時觀看人數最高達2146萬(日本vs德國)”,這是抖音轉播世界杯賽事以來兩周的直播數據。據了解,火山引擎作為該平臺世界杯直播的主力技術服務商,其大規模超高清直播、RTM超低延遲直播等技術均為首次亮相,為終端用戶提供了延時低至1s、大屏級畫質、穩定流暢的觀賽體驗,并延展出“無障礙字幕”“邊看邊聊”等無障礙功能和創新玩法。

“身臨其境”背后的科技

從1958年黑白電視里馬賽克般的全損畫質,到70年代墨西哥球場的彩色畫面,再到如今的超高清、流媒體平臺的興起,世界杯記錄了球迷觀賽方式的轉變,也見證了轉播技術的革新速度。

半年前,從央視手中獲得卡塔爾世界杯轉播權后,抖音投入到賽事直播體驗的優化中,為世界杯搭建專屬賽事直播間。主攻畫面增強的“自研高清低碼算法”、提升音頻互動體驗的“RTC”、RTM超低延遲直播等技術為線上觀賽注入了更多科技濃度,讓手機端用戶也能“身臨其境”,與盧塞爾球場“同頻共振”。賽事進入下半場,世界杯相關話題在抖音上的播放次數已達481.1億次。

穩定性和高可靠是保障世界杯這類全球性大型賽事直播體驗的底座。據了解,火山引擎邊緣云作為視頻云的底層能力支撐,為用戶創造了穩定、實時、流暢的視頻直播觀感。本屆世界杯期間,其支撐各轉播平臺創下接近45Tbps的帶寬峰值,支持了超千萬用戶同時在線流暢觀看高清直播。

據悉,此次世界杯,抖音在業內首次面向公眾移動設備、大規模提供超高清直播。采用自研的高清低碼算法,火山引擎視頻云針對體育賽事和HDR場景視頻進行了深度優化。此外,色彩增強、時空域降噪、超分等畫質增強技術,賦予了直播更優質的畫質,深度還原了賽場細節。

采用視頻云色彩增強畫面對比示意圖

如何讓超高清和低時延可以兼得,則對技術提出了更高要求。火山引擎RTM超低延遲直播技術也在本次世界杯直播中首次亮相,提供大規模分發能力的同時,可將直播畫面的端到端延遲降至最低1s左右,實現更高流暢、更低延遲。

豐富的互動玩法是此次抖音世界杯直播的另一亮點。以“邊看邊聊”功能為例,在支持500人的賽事直播間里,無論是梅西的“神助攻”、C羅的“最后一舞”,還是主題曲“下蛋歌”的洗腦旋律、半自動越位識別等“黑科技”,用戶都可以一起喊,一起侃。據抖音《2022世界杯小組賽觀賽報告》,嘗試這一互動玩法的用戶超1000萬。為實現“邊看邊聊”,火山引擎RTC技術攻克了高并發、外放回聲、通話人聲響度低等難關,提供了高品質的互動體驗,如通過音頻托管結合自研智能 3A 算法,確保外放場景下無回聲,同時,自適應人聲音量均衡、智能音頻閃避等技術,也讓用戶獲得更清晰流暢的語音交流體驗。

大型直播里的“無障礙”字幕

沙特對陣阿根廷,比賽進行到第9分鐘,由于沙特隊員的一次抱摔犯規,阿根廷隊獲得了點球機會,由梅西主罰。賽事正酣,一串串字幕出現在直播間屏幕左下角。

這是抖音在此次世界杯上線的功能——“無障礙字幕”直播間,其利用火山同傳和火山語音的技術,提供低延時、更精準的賽事解說字幕。接到直播流后,火山同傳對語音信號進行實時識別,并由人工在30秒內二次校對后推出字幕。

世界杯“無障礙字幕直播間”

“其實語音識別本身就是一種挑戰”,火山語音團隊指出,足球比賽瞬息萬變,解說中的很多口語現象不可避免,語序顛倒、差異化的語速語氣司空見慣,而現場的觀眾吶喊聲等大量背景噪音也容易被誤認為“嗯、啊、哈”等語氣詞,帶來識別困擾。

為此,該團隊以自研端到端的流式語音識別系統來應對上述問題。通過對大量足球解說場景的音頻特征進行分析并進行模型調優,確保在有背景音的情況下也能清晰地識別人聲,實現更好的流式字幕效果。

此外,大量的專業術語以及外籍教練與運動員的人名也存在識別難度。本次世界杯,該團隊提前整理了大量與足球、世界杯相關的語料,在這些語料的基礎上訓練語言模型,借助模型干預,提高了其在足球領域的適配性,使同傳字幕更專業。

中國聽障人群高達2780萬,“無障礙字幕直播間”打破了無聲畫面的靜謐,帶來了綠茵場上的鮮活沸騰。“以前觀看這種節目其實挺迷茫的,脫節帶來的孤獨感一度讓我很沮喪,如今我又找到了那份可以與朋友快樂同步的體驗!”“無障礙字幕直播間一出,似乎一下子就把我骨子里的體育DNA帶動起來了,再也不用擔心跟不上、聽不懂了”,部分聽障人士表示。

截至12月6日,世界杯無障礙字幕直播間累計觀看超1800萬次。據悉,火山同傳的無障礙字幕方案也在中國消防總隊春節消防安全科普、日本藝術家村上隆中國直播首秀、英國藝術家菲利普·考爾波特直播等多場抖音直播中得到了應用。

無處不在的視頻云

這場世界杯的線上狂歡背后,一個可以連接所有人的超視頻時代正在到來。視頻云作為一種新的生產力,從底層變革了觀看媒介和賽事轉播,全面放大了體育熱度。

據《2021抖音體育內容報告》,截至2021年12月,體育內容視頻累計點贊量超660億,足球內容的視頻播放量達到了864億次。不止體育賽事,視頻云被越來越廣泛地應用于企業直播、泛互游戲、在線教育、廣電領域,并為金融、醫療、汽車等傳統行業注入動能,在VR、虛擬人等新興領域,也有其作為技術底層支持方的身影。

我國持續推進數字新基建,視頻云行業亦在高速擴張。據IDC發布的《超視頻時代視頻云演進趨勢》白皮書,中國視頻云市場規模從2018年的30.6億美元,增長到2020年的69.6億美元,復合年均增長率為50.9%。IDC預測,到2025年,全球數據空間中,以視頻、圖片、音頻為主的娛樂數據和非娛樂圖像數據占比將超過70%。

與此同時,火山引擎、阿里云、華為云、騰訊云、金山云、聲網等一眾云廠商紛紛入局。如去年底,火山引擎的78項云產品亮相,其中,視頻云以“面向體驗”為核心,提供包括視頻點播、直播、實時音視頻、云游戲和云渲染等產品在內的經驗方案。今年7月,火山引擎發布了音視頻云端一體解決方案veVOS,向市場提供“抖音同款”的音視頻能力。

音視頻云端一體解決方案veVOS

據了解,在抖音推出低延時世界杯直播之前,火山引擎、騰訊云、阿里云三家企業曾于今年2月聯合發布“超低延時直播協議信令標準”,將直播的延遲壓縮到1秒,用于體育賽事、電競直播、電商直播等對延遲要求比較高的場景中。共同的標準,也意味著行業水準的整體提升。

隨著視頻內容行業競爭的白熱化,視頻云賽道也在不斷拓寬,解鎖數實融合新應用。譬如,搭建在線展廳還原線下參展體驗的文旅行業、為傳統線下門店打通線上銷路的新零售、解決偏遠山區教育資源匱乏的在線課堂、為實現高頻的異地小額貸款創建遠程銀行等。未來,以VR/AR、物聯網為代表的新場景,亦將成為新的增長空間。

文/張雨亭

免責聲明:本文由用戶上傳,如有侵權請聯系刪除!