其他

轉載《香港經濟日報》【張Sir講數】專欄文章——(五)利用AI輔助挖掘網絡意見的價值

2017-06-30 易研数据
 

來源:《香港經濟日報》


 

亞太區互聯網研究聯盟主席

香港源大數據首席顧問

張榮顯 博士


上期筆者提到,若把大數據「結構化」,等於為數據產生價值奠下基礎。此話怎說?隨著近年ABC(Artificial Intelligence,即AI的A,Big Data的B及Cloud Computing的C)的飛速發展,在人類史上讓三者同步出現及結合利用起來,使得過去很多被認為不可能實現或未及實現的東西,現在變得可能,對企業、政府及社會生活的方方面面,將產生無可估量的價值及影響。根據麥肯錫最新的報告--《人工智能:下一個數字前沿?》(ARTIFICIAL INTELLIGENCE:THE NEXT DIGITAL FRONTIER?)估計,全球科技巨頭於2016 年在人工智能的投資超過300億美元,其中 90% 花在研發和部署上, 10% 則花在人工智能併購上。研究發現,有少數幾家早期進入的公司已經開始從中獲益,使得其它公司在數字轉型上有急起直追的壓迫感,AI的應用也正進入最後突破階段


雖然AI正以雷霆萬鈞之勢向前推進,但筆者認為,當中涉及到人類的認知情景語義情緒解讀方面,光透過AI在當前是無法完全實現的。近年比較熱門的網絡意見、社交媒體監測及洞察等應用,正是此類,有別於坊間在高談闊論的機器人(如AlphaGo)、自動化載具、感知行為或電腦視覺類的AI。上述網絡意見,即網民在不同的網絡平台,例如社交媒體、論壇、網絡媒體上以文字、表情符號、圖片及影片的方式表達出來的態度和情緒,可通過在線實時的採集、結構化、挖掘及分析,其結果可讓政府、企業及各種組織獲得一系列的洞察力,從而形成戰略或調整策略,可更好地回應公衆對政府的政策以及消費者對品牌的體驗和服務的反饋。 


早在十多年前,分析網絡意見開始萌芽發展時,主要以技術爲導向,業內人員把精力集中在數據結構化及以語料方式對網絡文本進行正負面情緒的匹配,其分析結果主要以圖表的方式呈現,俗稱的圖表四大金剛:意見來源的分布、某個議題的聲量趨勢變化、正負面的情緒分布以及表示熱門關注點的詞雲圖。這些圖表雖然可以讓决策者及時瞭解到解網絡意見的散布及關注點,而情緒分析的準確度不高及指向模糊,加上在洞察力及決策資訊的提供方面,卻在在顯得軟弱無力。


近年,隨著機器學習的飛躍式發展,使得在通過AI的輔助,加上以人工編碼的方式,從而在上述圖表之外增加深度挖掘的分析層:利用大數據技術及機器學習,先從海量數據中找出未知的網絡意見形態,再以懂得行業知識的專業團隊在上述形成的已知形態中,設定深度挖掘的方向及分析類目,並驗證涉及人類的認知、情景語義和情緒類的數據。通過人機結合的方式,可以解決網絡意見中通常充滿了的暗語、俚語、反諷、上文下理邏輯及有條件式的意向。例如在Faceboook上有意見說:「搞乜鬼,今日辦證排隊快到冇朋友!」顯然是心情舒暢、對服務滿意的一種情緒表達,但純機器判斷可能是負面的。再如在某酒店預訂網站上有人說:「房間挺大,位置方便,但前台人員禮貌不好。」一般的機器理解,可能是正面居多,但對酒店來說,這顯然是一種負面的評價,房間大小和位置無法改變,如果只依賴機器的判斷,就會錯失了改善前台服務的機會。 


如今,網絡意見已成為影響企業發展和政府施政的晴雨錶。透過AI的輔助,加上人工的專業判斷,都可從中大大提升處理海量數據及挖掘其價值的能力。


點擊下方“閱讀原文”查看:《香港經濟日報》-【張sir講數】利用AI輔助挖掘網絡意見的價值


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存