人工智能數據標注的應用場景

導讀 “得數據者 得人工智能”。如今人工智能早已在我們的生活中屢見不鮮 像“Siri”、“指紋解鎖”、“人臉識別”等等都屬于人工智能的范疇

“得數據者 得人工智能”。如今人工智能早已在我們的生活中屢見不鮮 像“Siri”、“指紋解鎖”、“人臉識別”等等都屬于人工智能的范疇 然而人工智能的上游基礎產業 數據標注卻鮮為人知。數據標注是一個極為龐大的產業 在數標行業內部 從業者也必將隨著AI行業而一同進入細分市場追逐階段 可謂機遇與挑戰并行 為創業者創造力大量的機會 為社會造就了大量新興的就業機會。那么數據標注的應用場景都有哪些 它為什么如此火熱呢?

數據標注的應用場景

人臉識別

人臉識別也稱人像識別、面部識別 是基于人的臉部特征信息進行多年齡段、多角度、多表情、多光線的人臉圖像采集 從而完成身份識別的一種生物識別技術。人臉識別涉及的技術主要包括計算機視覺、圖像處理等。

人臉識別(視覺識別技術的一種應用)在國內的應用大致經歷從公共安全領域擴展到商業領域的過程。最初 機嘗高鐵站以及酒店等場景使用這項技術對個人身份進行驗證 隨后商業銀行也開始采用人臉識別實現遠程開戶。再之后 刷臉支付、刷臉門禁也相繼出現 人臉識別逐漸從少數有限場景滲透到人們的日常生活之中 目前 人臉識別技術已廣泛應用于多個領域 如金融、司法、公安、邊檢、航天、電力、教育、醫療等。

隨著人臉識別技術的進一步成熟和社會認同度的提高 其將應用在更多領域 給人們的生活帶來更多改變。

智能交通

近年來 隨著人工智能浪潮的興起 無人駕駛、智能交通安全系統一度走進我們的生活 國內許多公司紛紛投入到自動駕駛和無人駕駛的研究 例如百度啟動的“百度無人駕駛汽車”計劃 其自主研發的無人駕駛汽車Apollo還曾亮相2018年央視春晚。

再比如近日上海街頭出現的地鎖停車黑科技 當你停好車 協管員就會協管員將一張停車提示卡置于門把手上。停車7分鐘后 停車位下的指示燈由綠轉紅 金屬地鎖升起 卡住車身底盤。取車時 用手機掃了掃地面上的二維碼 停車時長、費用信息一目了然。支付停車費后 地面指示燈由紅轉綠 地鎖降下 電子發票也能實時獲齲

而這些都要依賴于人工智能數據標注的介入 對于行車視頻進行采集 路況進行提取 停車點進行標注 包括D點云障礙物、紅綠燈、車道燈及高精地圖。為行人識別、車輛識別、紅綠燈識別、車道線識別等技術提供精確訓練數據 為智能交通保駕護航。

智能語音

智能語音即實現人與機器以語言為紐帶的通信。人類大腦皮層每天處理的信息中 聲音信息占20% 它是溝通最重要的紐帶。人類對機器語音識別的探索始于20世紀50年代 迄今已逾70年。2016年 在深度神經網絡的幫助下 機器語音識別準確率第一次達到人類水平 意味著智能語音技術落地期到來。

數據標注主要在語音方面的應用場景主要是語音語言采集 語音內容加工處理 情感判斷 語音文字等轉化。為語音識別(ASR)、語音合成(TTS)等提高質量語音數據讓您的智能設備更懂得用戶心聲。我們常用到的小愛同學、天貓靜音 手機語音輸入 甚至包括有時候接到的營銷電話都有著智能語音的身影。

圖像處理之醫學圖像

醫學圖像處理是目前人工智能在醫療領域的典型應用 它的處理對象是由各種不同成像機理 如在臨床醫學中廣泛使用的核磁共振成像、超聲成像等生成的醫學影像。

傳統的醫學影像診斷 主要通過觀察二維切片圖去發現病變體 這往往需要依靠醫生的經驗來判斷。而利用計算機圖像處理技術 可以對醫學影像進行圖像分割、特征提娶定量分析和對比分析等工作 進而完成病灶識別與標注 針對腫瘤放療環節的影像的靶區自動勾畫 以及手術環節的三維影像重建。

該應用可以輔助醫生對病變體及其他目標區域進行定性甚至定量分析 從而大大提高醫療診斷的準確性和可靠性。另外 醫學圖像處理在醫療教學、手術規劃、手術仿真、各類醫學研究、醫學二維影像重建中也起到重要的輔助作用。

得數據者 得人工智能

人工智能主要算法應用領域集中在計算機視覺、語音識別/語音合成 以及自然語言處理三個方面。

圖像方面:一個新研發的計算機視覺算法需要上萬張到數十萬張不等的標注圖片訓練 新功能的開發需要近萬張圖片訓練 而定期優化算法也有上千張圖片的需求 一個用于智慧城市的算法應用 每年都有數十萬張圖片的穩定需求。

語音方面:頭部公司累計應用的標注數據集已達百萬小時以上 每年需求仍以20%-30%的增速上升 要求數據服務商不僅要掌握專業的聲學知識、數據標注經驗 還要擁有語音合成的算法能力。

自然語言處理方面:隨著工業、醫療、教育的AI應用產品進一步爆發 將會有更多交互方式出現 自然語義數據處理的需求將會持續增長 有望成為繼圖像、語音之后的第三大增量市常

這些海量的數據幾乎全部依賴數據標注師手工進行標注 數據標注行業的缺口十分可觀 并且數據標注已經在各行業產生了極廣的應用 行業也開始逐漸升級 走向產業化。在行業發展的過程中 行業人才的培養必然是最大的內驅力。

“得數據者 得人工智能”。未來 隨著AI應用場景逐漸多領域化 在數據標注行業內部 從業者也必將隨著AI行業而一同進入細分市場追逐階段 可謂機遇與挑戰并行。責任編輯:YYX

免責聲明:本文由用戶上傳,如有侵權請聯系刪除!