大发平台对刷:張勝:智能語音交互與機械人服務漸入佳境

大发平台对刷張勝:智能語音交互與機械人服務漸入佳境

【李佳琦被放鸽子】

張勝表示∟☆⊙,人類的語言和知識是開放性的?▽,在這種開放性的背景下⊙,讓機器達到完全正確響應人類對話♀∵,是一件非常難做到的事情π。所以自然語言處理才被比爾蓋茨稱為「人工智能皇冠上的明珠」?。另外〇△,在限定域下響應度自然語言處理技術就可以做到比較高的響應度♀◇□,用靈聚的數據舉例⊿⌒,目前可以做到99%以上⌒┊π。例如回答醫療服務的問題↑♂♀,進行語音交互的知識問答遊戲等等?,目前都可以做到高可用的響應度??△。

大发平台对刷

另外在機械人的情感表現力方面也取得一些進步∴。比如像阿里和百度的TTS現在都支持SSML標籤⊙↑□。通過人工大腦分析語境和輸出內容的語義自動插入SSML標籤就可以控制語音合成的效果了♂▽π。這樣↑♂∟,語音合成不再是單一的語速和語調∵⊙,而是根據語境和語義有不同的節奏﹡☆,甚至是自動配背景音樂♀π⊙。接下來有一段視頻∵∵,朗讀詩詞時的背景音樂都是TTS自動合成進去的?﹡。未來這樣的技術會使得我們機械人的情感表達更豐富π。另外☆⊙◇,在高噪聲環境下的語音識別一直是很頭痛的問題◇△,目前通過非等距MIC陣列+機器視覺成功解決了高噪雜環境的語音識別問題π♂↑,也使得智能語音服務的場景可以更廣泛了♂。

當前技術和市場環境下⊙∵,人工智能還做不到真正自如的對話↑↑π,尤其是機械人還沒有自己的思考和觀點♂∵。我們目前在落地智能語音服務場景的時候會遇到很多掣肘的問題┊⌒,現在我們來看看當前的技術到底發展到什麼程度↑∵。

通過開放域加限定域的組合∟?┊,目前已經可以在垂直場景中做到比較好的體驗┊,尤其是可以在局部替代人工的工作↑。這裡有一段視頻〇,是展示實際的點餐案例□,大家可以先看一下♀♂。從視頻中大家可以看到這樣一些能力:第一〇,一句話包含多個意圖◇π,甚至相反的意圖☆,機器都可以理解∵?,例如:給我來兩杯咖啡△,一杯要冷的一杯要熱的∵⊙,冷的要拿鐵♀〇?,熱的要卡布奇諾☆♀,算了拿鐵不要了;第二?△,通過配套的CMS系統⊙,餐廳服務員可以自己修改菜單內容♂⊙﹡,不再需要有技術公司進行訓練∴,這樣就方便大規模的普及應用♂。像這樣一些服務技能可以同時ToB和ToC↑◇,比如我們做的醫療服務技能也是如此π。

在智能語音服務能力方面?,現在我們已經可以做很多事情?。早幾年大家都想擁有一個像科幻電影中的機械人△☆,但以目前的軟硬件技術目前還做不到♂﹡。但是┊﹡,當行業內的需求開始務實之後﹡∴π,我們發現很多領域已經可以提供有價值的服務了∵↑⊙。比如說↑□∴,剛剛提到的生活助理可以幫你呼出電話、制定提醒∴,在一些商務場景中♂,機械人可以提供迎賓、講解、導購、推薦、客服服務等∴⌒﹡。

第三在智慧養老和智能家居方面的趨勢◇∵☆。我認為未來大屏幕電視機可能會成為智慧養老的一個真正的智能控制中心↑∵,而不是一個具體的機械人▽〇。因為在電視機上的虛擬人既可以成為老人的孫子形象?△↑,也可以是老人當年夢中情人的印象↑﹡⊿。通過電視和分佈在屋內多處的語音交互控制模組可以控制全屋π◇,而全屋各個設備不需要全部裝上主機和屏幕♂▽▽。此外還可以跟老人的智能手錶進行協同控制⊿π,並且可以實現控制權自動交接等等□。

對於未來的趨勢我們也有一些觀察♂〇,這裏和大家分享一下↑↑∟。首先就是超級技能的生態♀∵。從亞馬遜開始﹡⊿,國內的阿里、華為、小米、百度、騰訊、訊飛都在構築自己智能開放平台▽∴☆。這些平台都採用了技能的方式﹡♂,允許第三方服務商發佈技能┊⊿。但是這樣發佈的技能又存在一些問題⊙,例如它沒有實現跨平台跨終端的服務♂〇﹡。包括基於平台本身的能力所研發的技能▽◇,它的服務能力非常有限▽。所以Super Skills就顯得很有必要☆。Super Skills具備兩個特徵〇,第一♂⊿,一個技能裡面包含多個技能、能力△,可以更完美的解決場景的服務需求;第二♂∵⌒,它打通了各個不同的平台和終端☆∟,甚至連B端和C端都打通∵♀,比如靈聚最近推出的智慧醫療服務技能﹡。將來就是同時使用天貓精靈音箱和百度音箱的人實際是可以互通他的個人數據的◇∴。

那麼從技術角度出發∵,目前的NLP技術到底能實現什麼△?∟?從我們自己的實驗數據分析∟∴⌒,首先在開放域對話中♂,機器的真實響應度接近50%∴↑↑。人類的語言和知識是開放性的◇∵,在這種開放性的背景下□☆,讓機器達到完全正確響應人類對話〇﹡∵,是一件非常難做到的事情♂◇。所以自然語言處理才被比爾蓋茨稱為「人工智能皇冠上的明珠」┊⊙⊙。另外▽☆,在限定域下響應度自然語言處理技術就可以做到比較高的響應度♂◇〇,用靈聚的數據舉例♂◇,目前可以做到99%以上⌒π▽。例如回答醫療服務的問題?♂↑,進行語音交互的知識問答遊戲等等⌒,目前都可以做到高可用的響應度〇┊△。另外從技術上來講☆,還有另外一個詞彙□☆,叫做多輪交互∴⊙,通常是指人類與機械人對話所能達到的對話輪次∴。從理論角度⊙,多輪交互無論是開放域還是限定域都可以做到無限輪次↑♂,但是人的心理體驗不同△∵,不一定能進行無限輪次∟?。比如┊♂,在當前開放域對話測試時↑,用戶和機械人對話20多輪之後就不想說話了?∵,因為隨着聊天的推進?┊,用戶會發現交互的內容在兜圈子〇,或者機械人發起的話題引不起用戶的聊天興趣π,用戶就終止對話了♀。因為目前機械人□♀⊿,還不能從語音語義和視覺的角度去理解人類的情感∴〇∵,而對話通常是以情感作為支撐的♂,所以目前在通用的開放域對話下□∟▽,多輪對話做的並不夠好♂﹡。當然在一些任務型場景下□▽,多輪的對話就可以支撐用戶完成一項任務▽,例如靈聚可以通過任務型對話▽◇,在用戶不看屏幕的情況下﹡,呼出電話、發出短訊⊙△π。

首先我們明確機械人的概念〇┊,機械人不一定有硬件本體↑△〇,它可能也是虛擬的形象△。例如它可能是手機的智能助理♂↑♂,它的載體也可能是一個音箱↑⊙♀。

大发平台对刷

在正式分享之前先給大家看一段視頻∵⊿,這是知名度很高的機械人索菲亞﹡,最近一個科技展上又報導了它∟△◇。視頻看完了⌒⊿∴,大家通常會驚呼◇☆☆,這個機械人這麼聰明嗎〇♂?那麼索非亞到底怎麼回事♂◇♂?真的那麼厲害嗎◇?索非亞最厲害的是面部表情控制♂∴〇。剛才那段視頻其實在最後主持人有講到:今天我們所有的對話其實是預先設定好的▽□↑,但是大家都沒有注意那句話⊿,結果很多人誤以為索菲亞特別厲害□。

自創辦以來△∴,靈聚一直在堅持NLP底層技術研發┊,目前靈聚公司是擁有NLP核心技術的智能語音服務方案集成商♀。簡單來說↑﹡,機械人與人的對話是不是夠聰明⊙,準確響應度如何⊙∵,其實就是由NLP技術決定的?。靈聚一方面提供通用NLP技術對外提供賦能服務♂∴△,比如華為、思必馳等平台以及軟銀、優必選、康力優藍、穿山甲等機械人;同時靈聚也在打造服務垂直場景⊙↑♂,使用Super  Skills的方式☆,實現跨平台、跨終端∟,最終形成生態♂。在這一方面⌒↑,靈聚也在與BAT、米等各大平台進行合作⊿☆☆,目前在醫療、稅務、教育等場景推動落地∵↑△。

大发平台对刷

另外♂﹡?,日常生活中我們經常接到一些推銷電話♂,聽了好半天▽♂,才發現原來是一個機械人△⊙。這類機械人大多是用了一點關鍵詞加上預先錄好的錄音〇。所以人反問幾句話馬上知道它是機械人∟,不是真人π▽﹡。

新浪財經訊 由中國商務部、科技部、工信部、國家發改委、農業農村部、國家知識產權局、中國科學院、中國工程院等國家部委和深圳市人民政府共同舉辦的「第二十一屆中國國際高新技術成果交易會」於2019年11月13日-17日在中國深圳舉行△▽。靈聚信息科技有限公司CEO張勝出席「未來科技峰會」交流會並演講﹡▽♂。

第三π△,機械人不是無所不能的⊙⊙┊。現在的企業用戶越來越務實的認識到機械人擅長:重複性的工作和人無法做的工作⌒⊿,比如一些危險的工作∵,也例如安防巡邏工作♀,或者是7×24小時的不間斷客服工作□。基於這樣的務實認知▽∟,才有現在更加務實和廣泛的商業落地場景⊙∵♀。

第二┊∴,機械人智能語音服務不是機械人硬件終端〇▽,其智能是由背後的「大腦」產生的┊□⌒。而這個「大腦」通常是在服務端□。目前NLP技術需要依賴大量的數據和算法⊙↑,知識圖譜和深度學習訓練的數據都非常大▽⊙┊,開放域通用NLP的數據量和計算模型數量更加龐大π﹡♂,所以一般無法在算力較小的終端芯片中運行⊙,也正因為如此⊙△,「大腦」也常被人們稱為「雲腦」☆。不過☆,在特殊行業應用中?,我們可以把雲端的能力固化到本地局域網的服務器或者是PC上?,這是離線本地化交付♀↑◇。

大发平台对刷

第二是輕量級的智慧服務♂☆∟。此前許多智能語音服務需要與業務系統深度對接∟▽,遇到實現難度大、交付周期長等諸多問題↑﹡△,主要是想一步到位解決問題∟□,但目前人工智能技術整體處於初級階段♀π♂,還在快速發展☆☆,現階段不可能一步到位解決所有問題☆□。打造高性價比和快速個性化的輕量級智能語音服務集成方案可以在很多場所替代人ππ⊙,因此更容易大規模普及應用⌒。

新浪聲明:所有會議實錄均為現場速記整理∟,未經演講者審閱⊿┊,新浪網登載此文出於傳遞更多信息之目的☆π,並不意味着贊同其觀點或證實其描述┊。

大发平台对刷

以下為演講實錄:各位來賓大家好?♂⌒,非常榮幸和大家分享我們觀察到的智能語音服務的發展趨勢ππ♂。我本人在2013年創立廣州靈聚信息科技有限公司∵,同時我也是廣東省遊戲產業協會的秘書長∵〇。

大发平台对刷

最後π,對於未來∵,隨着人工智能越來越多普及到生活的方方面面∴⊿♂,在便捷的同時我們將面臨一個很大的問題?┊,就是用戶隱私與更加優質的用戶體驗之間的矛盾問題┊。這個問題需要所有從業者一起思考如何平衡這個矛盾□⊙。謝謝大家∟。

  路给山里人带来的改变不仅仅是建新房。

本文标题:張勝:智能語音交互與機械人服務漸入佳境

关键词:大发平台对刷

大发平台对刷 Copyright © 2020 All Rights Reserved

張勝:智能語音交互與機械人服務漸入佳境

【李佳琦被放鸽子】

張勝表示∟☆⊙,人類的語言和知識是開放性的?▽,在這種開放性的背景下⊙,讓機器達到完全正確響應人類對話♀∵,是一件非常難做到的事情π。所以自然語言處理才被比爾蓋茨稱為「人工智能皇冠上的明珠」?。另外〇△,在限定域下響應度自然語言處理技術就可以做到比較高的響應度♀◇□,用靈聚的數據舉例⊿⌒,目前可以做到99%以上⌒┊π。例如回答醫療服務的問題↑♂♀,進行語音交互的知識問答遊戲等等?,目前都可以做到高可用的響應度??△。

大发平台对刷

另外在機械人的情感表現力方面也取得一些進步∴。比如像阿里和百度的TTS現在都支持SSML標籤⊙↑□。通過人工大腦分析語境和輸出內容的語義自動插入SSML標籤就可以控制語音合成的效果了♂▽π。這樣↑♂∟,語音合成不再是單一的語速和語調∵⊙,而是根據語境和語義有不同的節奏﹡☆,甚至是自動配背景音樂♀π⊙。接下來有一段視頻∵∵,朗讀詩詞時的背景音樂都是TTS自動合成進去的?﹡。未來這樣的技術會使得我們機械人的情感表達更豐富π。另外☆⊙◇,在高噪聲環境下的語音識別一直是很頭痛的問題◇△,目前通過非等距MIC陣列+機器視覺成功解決了高噪雜環境的語音識別問題π♂↑,也使得智能語音服務的場景可以更廣泛了♂。

當前技術和市場環境下⊙∵,人工智能還做不到真正自如的對話↑↑π,尤其是機械人還沒有自己的思考和觀點♂∵。我們目前在落地智能語音服務場景的時候會遇到很多掣肘的問題┊⌒,現在我們來看看當前的技術到底發展到什麼程度↑∵。

通過開放域加限定域的組合∟?┊,目前已經可以在垂直場景中做到比較好的體驗┊,尤其是可以在局部替代人工的工作↑。這裡有一段視頻〇,是展示實際的點餐案例□,大家可以先看一下♀♂。從視頻中大家可以看到這樣一些能力:第一〇,一句話包含多個意圖◇π,甚至相反的意圖☆,機器都可以理解∵?,例如:給我來兩杯咖啡△,一杯要冷的一杯要熱的∵⊙,冷的要拿鐵♀〇?,熱的要卡布奇諾☆♀,算了拿鐵不要了;第二?△,通過配套的CMS系統⊙,餐廳服務員可以自己修改菜單內容♂⊙﹡,不再需要有技術公司進行訓練∴,這樣就方便大規模的普及應用♂。像這樣一些服務技能可以同時ToB和ToC↑◇,比如我們做的醫療服務技能也是如此π。

在智能語音服務能力方面?,現在我們已經可以做很多事情?。早幾年大家都想擁有一個像科幻電影中的機械人△☆,但以目前的軟硬件技術目前還做不到♂﹡。但是┊﹡,當行業內的需求開始務實之後﹡∴π,我們發現很多領域已經可以提供有價值的服務了∵↑⊙。比如說↑□∴,剛剛提到的生活助理可以幫你呼出電話、制定提醒∴,在一些商務場景中♂,機械人可以提供迎賓、講解、導購、推薦、客服服務等∴⌒﹡。

第三在智慧養老和智能家居方面的趨勢◇∵☆。我認為未來大屏幕電視機可能會成為智慧養老的一個真正的智能控制中心↑∵,而不是一個具體的機械人▽〇。因為在電視機上的虛擬人既可以成為老人的孫子形象?△↑,也可以是老人當年夢中情人的印象↑﹡⊿。通過電視和分佈在屋內多處的語音交互控制模組可以控制全屋π◇,而全屋各個設備不需要全部裝上主機和屏幕♂▽▽。此外還可以跟老人的智能手錶進行協同控制⊿π,並且可以實現控制權自動交接等等□。

對於未來的趨勢我們也有一些觀察♂〇,這裏和大家分享一下↑↑∟。首先就是超級技能的生態♀∵。從亞馬遜開始﹡⊿,國內的阿里、華為、小米、百度、騰訊、訊飛都在構築自己智能開放平台▽∴☆。這些平台都採用了技能的方式﹡♂,允許第三方服務商發佈技能┊⊿。但是這樣發佈的技能又存在一些問題⊙,例如它沒有實現跨平台跨終端的服務♂〇﹡。包括基於平台本身的能力所研發的技能▽◇,它的服務能力非常有限▽。所以Super Skills就顯得很有必要☆。Super Skills具備兩個特徵〇,第一♂⊿,一個技能裡面包含多個技能、能力△,可以更完美的解決場景的服務需求;第二♂∵⌒,它打通了各個不同的平台和終端☆∟,甚至連B端和C端都打通∵♀,比如靈聚最近推出的智慧醫療服務技能﹡。將來就是同時使用天貓精靈音箱和百度音箱的人實際是可以互通他的個人數據的◇∴。

那麼從技術角度出發∵,目前的NLP技術到底能實現什麼△?∟?從我們自己的實驗數據分析∟∴⌒,首先在開放域對話中♂,機器的真實響應度接近50%∴↑↑。人類的語言和知識是開放性的◇∵,在這種開放性的背景下□☆,讓機器達到完全正確響應人類對話〇﹡∵,是一件非常難做到的事情♂◇。所以自然語言處理才被比爾蓋茨稱為「人工智能皇冠上的明珠」┊⊙⊙。另外▽☆,在限定域下響應度自然語言處理技術就可以做到比較高的響應度♂◇〇,用靈聚的數據舉例♂◇,目前可以做到99%以上⌒π▽。例如回答醫療服務的問題?♂↑,進行語音交互的知識問答遊戲等等⌒,目前都可以做到高可用的響應度〇┊△。另外從技術上來講☆,還有另外一個詞彙□☆,叫做多輪交互∴⊙,通常是指人類與機械人對話所能達到的對話輪次∴。從理論角度⊙,多輪交互無論是開放域還是限定域都可以做到無限輪次↑♂,但是人的心理體驗不同△∵,不一定能進行無限輪次∟?。比如┊♂,在當前開放域對話測試時↑,用戶和機械人對話20多輪之後就不想說話了?∵,因為隨着聊天的推進?┊,用戶會發現交互的內容在兜圈子〇,或者機械人發起的話題引不起用戶的聊天興趣π,用戶就終止對話了♀。因為目前機械人□♀⊿,還不能從語音語義和視覺的角度去理解人類的情感∴〇∵,而對話通常是以情感作為支撐的♂,所以目前在通用的開放域對話下□∟▽,多輪對話做的並不夠好♂﹡。當然在一些任務型場景下□▽,多輪的對話就可以支撐用戶完成一項任務▽,例如靈聚可以通過任務型對話▽◇,在用戶不看屏幕的情況下﹡,呼出電話、發出短訊⊙△π。

首先我們明確機械人的概念〇┊,機械人不一定有硬件本體↑△〇,它可能也是虛擬的形象△。例如它可能是手機的智能助理♂↑♂,它的載體也可能是一個音箱↑⊙♀。

大发平台对刷

在正式分享之前先給大家看一段視頻∵⊿,這是知名度很高的機械人索菲亞﹡,最近一個科技展上又報導了它∟△◇。視頻看完了⌒⊿∴,大家通常會驚呼◇☆☆,這個機械人這麼聰明嗎〇♂?那麼索非亞到底怎麼回事♂◇♂?真的那麼厲害嗎◇?索非亞最厲害的是面部表情控制♂∴〇。剛才那段視頻其實在最後主持人有講到:今天我們所有的對話其實是預先設定好的▽□↑,但是大家都沒有注意那句話⊿,結果很多人誤以為索菲亞特別厲害□。

自創辦以來△∴,靈聚一直在堅持NLP底層技術研發┊,目前靈聚公司是擁有NLP核心技術的智能語音服務方案集成商♀。簡單來說↑﹡,機械人與人的對話是不是夠聰明⊙,準確響應度如何⊙∵,其實就是由NLP技術決定的?。靈聚一方面提供通用NLP技術對外提供賦能服務♂∴△,比如華為、思必馳等平台以及軟銀、優必選、康力優藍、穿山甲等機械人;同時靈聚也在打造服務垂直場景⊙↑♂,使用Super  Skills的方式☆,實現跨平台、跨終端∟,最終形成生態♂。在這一方面⌒↑,靈聚也在與BAT、米等各大平台進行合作⊿☆☆,目前在醫療、稅務、教育等場景推動落地∵↑△。

大发平台对刷

另外♂﹡?,日常生活中我們經常接到一些推銷電話♂,聽了好半天▽♂,才發現原來是一個機械人△⊙。這類機械人大多是用了一點關鍵詞加上預先錄好的錄音〇。所以人反問幾句話馬上知道它是機械人∟,不是真人π▽﹡。

新浪財經訊 由中國商務部、科技部、工信部、國家發改委、農業農村部、國家知識產權局、中國科學院、中國工程院等國家部委和深圳市人民政府共同舉辦的「第二十一屆中國國際高新技術成果交易會」於2019年11月13日-17日在中國深圳舉行△▽。靈聚信息科技有限公司CEO張勝出席「未來科技峰會」交流會並演講﹡▽♂。

第三π△,機械人不是無所不能的⊙⊙┊。現在的企業用戶越來越務實的認識到機械人擅長:重複性的工作和人無法做的工作⌒⊿,比如一些危險的工作∵,也例如安防巡邏工作♀,或者是7×24小時的不間斷客服工作□。基於這樣的務實認知▽∟,才有現在更加務實和廣泛的商業落地場景⊙∵♀。

第二┊∴,機械人智能語音服務不是機械人硬件終端〇▽,其智能是由背後的「大腦」產生的┊□⌒。而這個「大腦」通常是在服務端□。目前NLP技術需要依賴大量的數據和算法⊙↑,知識圖譜和深度學習訓練的數據都非常大▽⊙┊,開放域通用NLP的數據量和計算模型數量更加龐大π﹡♂,所以一般無法在算力較小的終端芯片中運行⊙,也正因為如此⊙△,「大腦」也常被人們稱為「雲腦」☆。不過☆,在特殊行業應用中?,我們可以把雲端的能力固化到本地局域網的服務器或者是PC上?,這是離線本地化交付♀↑◇。

大发平台对刷

第二是輕量級的智慧服務♂☆∟。此前許多智能語音服務需要與業務系統深度對接∟▽,遇到實現難度大、交付周期長等諸多問題↑﹡△,主要是想一步到位解決問題∟□,但目前人工智能技術整體處於初級階段♀π♂,還在快速發展☆☆,現階段不可能一步到位解決所有問題☆□。打造高性價比和快速個性化的輕量級智能語音服務集成方案可以在很多場所替代人ππ⊙,因此更容易大規模普及應用⌒。

新浪聲明:所有會議實錄均為現場速記整理∟,未經演講者審閱⊿┊,新浪網登載此文出於傳遞更多信息之目的☆π,並不意味着贊同其觀點或證實其描述┊。

大发平台对刷

以下為演講實錄:各位來賓大家好?♂⌒,非常榮幸和大家分享我們觀察到的智能語音服務的發展趨勢ππ♂。我本人在2013年創立廣州靈聚信息科技有限公司∵,同時我也是廣東省遊戲產業協會的秘書長∵〇。

大发平台对刷

最後π,對於未來∵,隨着人工智能越來越多普及到生活的方方面面∴⊿♂,在便捷的同時我們將面臨一個很大的問題?┊,就是用戶隱私與更加優質的用戶體驗之間的矛盾問題┊。這個問題需要所有從業者一起思考如何平衡這個矛盾□⊙。謝謝大家∟。

多层建筑很多楼梯间都是敞开的,发生火灾烟会直接涌入楼梯间,不能跑;如果是防烟楼梯间或封闭楼梯间,但楼梯间的门是敞开的,发现里面有烟不要跑;如果楼梯间里面堆放杂物发生燃烧,更不能从楼梯间跑。

本文标题:張勝:智能語音交互與機械人服務漸入佳境

关键词:大发平台对刷