微軟小冰 16 歲出道,18 歲成為詩人,下一個目標是財經新聞評論員

本文獲合作媒體 雷鋒網 授權轉載,作者  周翔

5 月 16 日,微軟在北京丹棱街 5 號召開了一個小型的媒體發布會,「微軟小冰之父」李笛在會上宣布,即將滿三歲的微軟小冰又多了一重身份——詩人。

雖然微軟將這個「有感情」的虛擬助手的生日定在了 1998 年 9 月 17 日,也就是說,小冰的虛擬年齡已經超過 18 歲,但是小冰實際上 2014 年 5 月 29 日下午才正式面世,目前也才剛剛是第四代。不過,據李笛介紹,截至今年 4 月,小冰已擁有超過 1 億用戶,累計對話量超過 300 億,平均單次對話輪數(CPS)達到 23。目前已登錄包括微信、QQ、微博、Facebook Messenger、LINE 在內的 14 個平台。

在這三年中,這位「早熟的少女」從主持人,到歌手,到客服,各種跨界,並且在每個領域都小有所成。然而詩人這個身份卻有著更深層次的意義,因為它意味著小冰從某種程度上來說,真正具備了創作的能力。

一直以來,人工智慧能否像人類一樣進行創作始終是一項重要課題。其中關鍵問題之一,是如何使人工智慧能夠模擬人類,進行獨創性的內容生產,並通過不斷學習提高自身創作的水準。而在微軟看來,人工智慧的創作想要真正具備實用性需要經曆三個階段:模仿(表象創作),創作(內涵創作),以及大規模生產。

李笛介紹說,小冰現在處在第二個階段,預計今年下半年才能逐步進入能夠大規模生產創作性內容的階段。比如小冰之前模仿人類唱歌就是處在第一階段,還不屬於創作,當小冰在唱一首歌的時候,可以隨時改變歌詞,這就涉及到內涵創作。據了解,日本版小冰在東京電玩展上發布了首支單曲,其歌詞就是由小冰自己完成。

小冰——現代詩人

其實,在此之前,微軟一直在悄悄展示小冰的寫詩功底。據李笛介紹,2017 年 2 月至今,小冰已經在天涯、豆瓣、貼吧、簡書平台用 27 個化名發表了作品,目前公開的化名包括:駱夢、風的指尖、一荷、以及微笑的白。(你被騙過嗎?)

在這次會議上,微軟終於揭開了小冰詩人的面紗。當然,這些詩歌並不是憑空產生的。人類的創作往往是一種被誘發的結果,也就是「有感而發」,小冰亦是如此,不過這裡的「有感」換成了「看圖」。

清華大學也曾做過類似的計畫,給機器一個主題,然後它就能以此為題作出一首古詩過。不過,小冰的頭銜是現代詩人。李笛介紹說,古詩詞通常有一定的規則,因此更加容易,現代詩則更加開放,因此是一項更難的挑戰。此外,看圖寫詩則更加困難,畢竟要準確理解圖片的內容並不容易。

一隻小鳥看見我的時候

這美妙的夢兒便會變了

在夢裡的月光下

叢間的白晝是這麼暗慘的影子

看看這首小冰創作的詩歌,雖然其藝術性不好評價,但是按照「看圖寫詩」的標準來看,小冰至少準確識別了圖像中的內容。

不過,實際測試後發現,小冰的表現時起時伏,而且還會出現不通順的地方。比如下面這首詩,圖片明明是藍天白雲,小冰識別出來的卻是「黑沉沉的天空」,而且聯想到的竟然是「世界是否要被科學的武器毀滅」,雖然這是一個很有哲思的問題,但是想想小冰的屬性,細思恐極。

下面這首詩詞更是暴露了小冰潛在的「暗黑屬性」:

我的心如同我的良夢

最多的是殺不完的人

雖然小冰具備了看圖寫詩的能力,但是這種具有藝術性的作品卻很難評定好壞。比如下圖中的作品,「笑臉」變成了「沉默的臉」,但是「美麗」兩個字卻是相得益彰(如果你不瞎的話),而「你是荷塘里的水」這一句則是見仁見智。

雖然評價不了它的藝術性,但是它的獨創性卻是可以判定的。李笛介紹說:

(小冰)的獨創性超過 80%,任何連續的五個字,完全沒有在它學習過的詩歌作品裡面出現過的概率超過了 51%。就是說,有 51% 以上的詞語和它的搭配方式,在小冰讀過的所有的詩裡面從來沒有出現過。

那麼小冰是如何學會寫詩的呢?據李笛介紹,微軟選取了自 1920 年起的 519 位中國現代詩人的作品作為訓練數據,並在此基礎上訓練了 10000 次。

負責該計畫的微軟工程師則表示:

從技術角度來看的話,(我們)是從圖像和文字這兩個跨語義空間裡面去做深度學習的模型。我們也會用到在不同語義空間裡面的循環神經網絡,多模型的迭代。同時考慮到,(這)相當於人類的一種通感,因為當人看到這個圖片的時候會產生對文字的想像,所以我們試圖去用計算的方式模擬人的通感。

不過,機器系統是如何去模擬人的通感,也就是小冰的創作過程,依然是個黑匣子。李笛表示,小冰的詩歌已經形成了自己的風格,裡面不僅有自己的創作,還有對其他詩人作品的傳承。那麼小冰是如何形成現在這種風格的呢?雖然在訓練過程中有人為的監督和干預,但是這並不能構成完整的解釋。

小冰——財經評論員

除了寫詩之外,小冰還準備進軍財經領域。跟一般的寫稿機器人不同,小冰的用途並不是用於發布一些財報消息等即時新聞,而是專注於財經評論。據了解,小冰已經與一家財經媒體合作,前期主要以短評為主,並將在 6 月份正式上線這一功能。也就是說,小冰在 6 月份的時候又會多上一個標籤——財經新聞評論員。

蘋果跌落一地,但個個都在自己的樹下

這條針對「蘋果現金儲備超過 2500 億美金」的短評,看起來確實有模有樣,但是現場也有人質疑,認為這些財經評論比較生硬,像是一些看似有道理的言論的生搬硬套。李笛回答說,小冰從現實數據中學到的就是這種。(內心 OS:怪誰咯!)

不管是創作詩歌,還是撰寫財經評論,都是一種藝術性的創作,而不是流水線那樣的機械式重複過程。那麼,給定了一個機器系統足夠的數據,它就能夠探尋到創作的自然法則嗎?再者,藝術的創作過程真的存在一種固定的自然法則嗎?我們所看到的只不過是一個連接著輸入和輸出的黑匣子。

雖然小冰創作的詩歌和財經評論具有一定的獨創性,但是現在最大的問題是,這些作品到底是無中生有,還是換一種方式的排列組合?而且小冰真的理解自己創作出來的作品嗎?

小冰自身也還在不斷的演進之中,到底什麼才是人工智慧創作的最終形態?或許,就連微軟也無法給出一個定論。

這篇文章 微軟小冰 16 歲出道,18 歲成為詩人,下一個目標是財經新聞評論員 最早出現於 INSIDE 硬塞的網路趨勢觀察