深度學習:
自然語言處理的秘密武器

自然語言處理(Natural Language Processing,簡稱NLP)正逐步改變人工智慧理解人類的想法與行為的方式,而其中深度學習更扮演著至關重要的角色。在此演變下,品牌與行銷應如何從中受益?

有時,在嘗試建構人工智慧的過程中,才能體會到人類心智的複雜性。自然語言處理便是一個很好的例子,該技術致力於探討人工智慧如何辨別人類語言中的細微差異。

以英文單字為例,「plaster」(灰泥,一種用於覆蓋牆面的塗料)和「plasters」(OK繃)二字間的差異也許看似簡單,但是對人工智慧來說,這中間的過程卻一點都不輕鬆。研究人員必須事先準備大量的定義、與「plasters」有關的語料以供人工智慧學習,才能有足夠的能力在真實情境中區辨消費者所搜尋的究竟是居家裝潢用的塗料,或是保護傷口用的急救產品。

Appier的首席人工智慧科學家孫民指出,為了讓傳統方法發揮作用,「研究人員往往須明確定義每個詞彙的含義,以及詞彙間的關係。」傳統方法仰賴高度的人為干預來定義各種例外情況,然而這樣的作法會削弱人工智慧的運作效率。

傳統方法雖然讓人工智慧具備基礎的語言處理能力,然而,其學習過程偏向採用「死記硬背」的方式。換言之,研究人員不但需要預先定義許多文意並且統整許多定義間的關係,在這些事務中,也需要大量人為介入處理。因此,透過傳統方法建構而成的人工智慧,往往缺乏商務應用方面的語言處理能力。

人類的溝通方式要比單純死背複雜得多。語言本身具有高度「針對性」,而這種存在於字裡行間外的特定情境(例如作者與其書寫對象間的關係),會影響溝通時所選用的詞彙、句法、拼字,以及標點符號的呈現方式。

孫民還表示:「語言隨著時間不斷演變,人們在正式文件中和網路上所使用的語言有著明顯差異。想讓傳統方法在現今的語言環境中發揮作用,除了得建構專門的書面英語、美式英語和澳式英語等知識庫外,還須擁有一個包含Reddit這類網站中常見用語的專門知識庫。然而,傳統方法在應用上並不具備這樣的可擴充性。」

自然語言處理和深度學習間的關係

深度學習正好解決了這方面的問題。在自然語言處理領域中,深度學習機制讓人工智慧能夠透過觀察單詞或短句在段落中的使用方式,來理解這些語言的含義。也就是說,單詞或短句的意義以及字詞之間的關係,是直接從原始段落中習得,而非經由預先定義的文章內容,或是仰賴人力來進行闡釋或定義關係。這意味著當消費者搜尋「clear plaster」(透明OK繃)的時候,人工智慧能夠明白其所尋找的是急救類的物品,而不是裝潢用的材料;這樣的運作機制讓自然語言處理更貼近人類的學習模式。

孫民指出,在電腦「學會每個獨立詞彙所代表的詞向量」前,深度學習機制仍須透過大量文本(語料庫)的分析來進行語言學習,而這些文本通常來自新聞網站、維基百科和Reddit網站上的評論。詞向量的概念指的是將相似的單詞映射到向量空間中,以觀察其彼此靠近的程度,並藉此判斷在同一上下文中的不同單詞,在語義上是否相近。

深度學習和詞向量的應用,不但使人工智慧無須透過人為干預,便能增進語言處理方面的精確性,同時也為關鍵字行銷和更精準的情感分析開闢了新的發展方向。

詞向量的概念在關鍵字行銷上的作用尤其明顯。在單憑人力的情況下,行銷人通常需預先根據行銷目標,自行構思一份關鍵字清單。然而,在深度學習的幫助下,企業只需在人工智慧中輸入一些「種子資料」,「然後這些資料便能在向量空間中尋找相似的關鍵字。」孫民提到。

假設有一家旅遊公司正在針對潛在顧客擬定關鍵字清單,他們可能會在清單中加入「度假」、「假期」、「班機」、「郵輪」、「短期旅遊」等關鍵字眼,這時精通自然語言處理的人工智慧工具還能從合適的上下文中,判定搜尋「宿霧」和「菲律賓」二字的使用者是否有意出外旅行。

此外,建立在深度學習上的自然語言處理機制可以更精準地進行情感分析,能根據關鍵字來判斷使用者在搜尋當下所抱持的是正面的或負面的感受。若使用者所搜尋的關鍵字是「宿霧」和「地震」,而不是「宿霧」和「潛水」,那麼人工智慧便會判定該使用者並非合適的旅遊行銷對象。孫民還表示:「透過自然語言分析,企業在消費者情感分析的精確度可以提高10%20%。」

基於深度學習的自然語言處理機制,有助於行銷人深入了解消費者的需求,從而形成更富價值的洞察。不但能協助企業擴大行銷活動所能觸及的對象,還能透過相關性更高的優惠訊息來抓住其目光。若行銷人一開始僅使用「旅遊」這個關鍵字來定義目標市場,那麼很有可能會錯失與搜尋「宿霧」和「潛水」二字的消費者互動的機會,但詞向量的應用卻可避免這類的情況發生。在掌握到消費者所使用的關鍵字後,企業便可針對特定地點推出相關的優惠方案,或是推薦東南亞其他潛水勝地的旅遊行程。

自然語言處理現階段的發展限制

儘管具備不少優勢,但目前的自然語言處理技術仍有不足之處,尤其是在文本生成方面。孫民坦言:「其在語言生成上的表現不如語言理解方面的表現穩定,有時會產出預想之外的內容,因此需要透過人力進行再確認的動作。」

另一項挑戰與用來訓練人工智慧的資料來源有關,孫民補充道:「由於人工智慧是直接使用研究人員所提供的資料來進行學習,因此若資料本身有問題或者內容有誤,那麼人工智慧產出的結果也會跟著受到影響。」換句話說,這部分也需要藉由人力來進行資料來源的查證工作。

即便如此,孫民仍充滿自信地表示,未來基於深度學習的自然語言處理機制有望在經過微調後,逐步降低人為干預的必要性。他也指出,該技術至目前為止「已成功為企業節省人力資源,並且使行銷工作更具可擴充性。」在接下來的數年內,人類將能更放心地讓聊天機器人處理複雜的查詢問題,以及推動進一步的行銷自動化工作。

就現階段而言,基於深度學習的自然語言處理所能為企業和行銷部門提供的協助(精準識別更廣泛的目標受眾,並根據其需求提供相關性高的優惠訊息),證明了其確實是一項富有價值的投資。人工智慧接下來的發展,著實令人期待。

想進一步了解深度學習如何幫助企業獲取顧客,以及改善與顧客間的互動關係?如須獲得更深入的洞察,歡迎下載Appier最新白皮書:「鎖定高價值應用程式使用者 : 運用深度學習提高獲取新客的行銷成效」。