數據標注工作室賺錢嗎 數據標注行業的前景

上個月 , 特斯拉首席執行官馬斯克表示 , 將在明年推出“Tesla Bot”人形機器人原型 , 以從事人們不喜歡做的危險、重復性或枯燥的工作 。 該計劃一經發布便引起了廣泛討論 , 國外媒體的焦點 , 放在了安全性上 。 而在國內 , 隱藏在人工智能產業鏈中一群人“小人物”卻開始浮出水面 , 并被輿論聚焦 。
他們是AI行業的賦能者 , 是人工智能背后的“人工” 。 在AI繁榮的背后 , 有億兆級的數據信息 , 在流水作業中 , 這些數據最終都會傳遞到名為“標注師們”的電腦前 , 被他們手動去“智能化” 。
他們扮演了“老師”的角色——手把手地傳授現實世界中的表情和動作 , 然后等著AI這位“學生”成長、離開 , 或許有一天這些“AI學生”將取代“老師”的位置 。 如今 , 隨著數據標注行業迭代升級 , 這些數據標注師或許很快就會離開舞臺……
入行、扎根
上海一座創意園區內 , 主管員劉夢緣(化名)正坐在自己的小隔間里 , 等著手下的標注師們發來成型的文檔 。
外面的工位上坐滿了員工 , 他們一個個都把腦袋湊近屏幕 , 脖子還向前探著 。 其中的一位員工正在做著“描點標注” , 將視頻按幀截取并放大 , 細致對臉部特征、骨骼彎曲點進行標注 , 由于截取的畫面像素低 , 大部分員工總是習慣性地一邊滑動鼠標滾輪一邊嘆氣 。

數據標注工作室賺錢嗎 數據標注行業的前景

文章插圖

員工們操作的“描點標注”是人臉識別前重要的步驟之一 , 除去“描點標注” , 還有分類標注、標框標注等 。 AI不是生來就能識別人的眼耳口鼻 , 它需要通過標注師繪制的人臉關鍵點 , 來建立對五官輪廓的認知 。 在此基礎上 , AI才可通過這些點構成的輪廓特征 , 完成一系列識別工作 。
當你“刷臉”解鎖手機、完成支付 , 當你進入火車站 , 檢票設備掃描面部時 , 都是在使用人臉識別的技術 。 而助力這項技術的 , 正是數據標注師們 。
在劉夢緣所在的公司 , 標注師們用細密、起伏的鼠標點擊聲制造出成千上萬個關鍵點 。 這項工作很“初級” , 卻也很艱難 , 劉夢緣在屋里偶爾會出來看一眼 , 然后見怪不怪地回到隔間 , “我以前也是這么過來的 , 正常 。 ”
她是從2018年入行的 , 從機械地錄入(數據清洗)工開始 , 幾個月后才正式接觸數據標注工作 。 她的第一個任務是給圖像中的人物打標簽:年齡、性別、人種、頭發、表情等 , 以供AI學習 。 而在見識了海量人物標簽后 , AI就像煉就了火眼金睛 , “一眼”認出人的特征來 。
“當時稅后5千多的工資 , 主要是門檻不高 , 其實說到底就是互聯網民工的角色吧” 。 當時的劉夢緣大專畢業后幾次應聘都不順 , 灰心喪氣之際她與“標注師”不期而遇 , 女生特有的細心和韌勁讓她一路堅持下來 , 直到現在 。
也正是在劉夢緣入行的2018年 , 數據標注公司的風口來臨 。 根據前瞻產業研究院統計 , 2017年數據標注相關融資事件達到9起 , 到2021年4月 , 共有18家公司獲得融資 , 投融資事件39起 。
數據標注工作室賺錢嗎 數據標注行業的前景

文章插圖

來源:前瞻產業研究院
跟著這一波潮流發展的是 , 許多數據服務公司也作為乙方進入到日益擴大的市場 , 為百度、阿里等大型互聯網公司 , 以及部分AI獨角獸企業提供服務 。
數據標注工作室賺錢嗎 數據標注行業的前景

文章插圖

圖片來源:人社部
2020年4月26日 , 人力資源與社會保障部發文正式宣布 , “人工智能訓練師”正式成為新職業 , 并納入國家職業分類目錄 。 預計到2022年 , 國內外相關從業人員有望達到500萬 。
行業向上 , 但“老師”們依舊用密集、艱辛的勞動輔助AI一步步走向成熟 。 光鮮的AI科技發布會在臺前風光無限 , 可標注師們的生活似乎變得有些困難了 。
“說是沒技術含量 , 精度要求在那里 , 很容易犯錯 , ”劉夢緣看著現在的手下的員工說道 。 每張圖片要標記的點位繁雜 , 稍有偏離就會產生錯誤 。 一張圖有錯 , 會影響到整個數據包數據 , 然后就是“回爐重造” 。
除了精度 , 疲倦是標注師最大的敵人 。 “這行干久了之后 , 我清楚地知道客戶要通過我們實現什么——就是把人腦當電腦用” , 劉夢緣笑著說道 。
大公司會用軟件監控標注師的疲勞程度 , 也算是一種人性化的體現 , “但小公司本來就是接人家剩下來的活 , 時間緊任務急 , 只能拼著命熬 , ”正是如此 , 劉夢緣的團隊里常年備著成箱的紅牛和西洋參含片 。

推薦閱讀