AI報道 / 待分類 / 上交大AI研究院首席科學家徐雷:中國人工...

0 0

   

上交大AI研究院首席科學家徐雷:中國人工智能研究真的世界領先?

原創
2019-10-12  AI報道

盡管人工智能不是新鮮的概念,從1956年被提出至今已逾一個甲子,但對于大多數人來說,從2016年AlphaGo戰勝圍棋世界冠軍李世石開始,才對人工智能略有耳詳。在此之前,人工智能在大眾輿論場中幾乎是長期沉默的。

但從學術界的視角來看,對人工智能的研究,猶如在盤山公路上爬坡,從未停止過。歐洲科學院院士、上海交大人工智能研究院首席科學家徐雷就是一位從上世紀八十年代初就加入這個領域的老一輩研究者,談及隨機霍夫變換RHT、分類器組合、對手競爭學習RPCL、非線性PCA學習、Mixture of Experts, EM 算法,LMSER學習、BYY 學習等神經網絡和模式識別領域中的多項先驅成果時,都繞不開他的名字。在這些領域中,徐雷自九十年代初起就一直是國際上最有影響的幾位華人之一。

在37年余的人工智能研究生涯中,徐雷做出了多個廣為引用的成果。2001年當選IEEE Fellow,是從計算智能學會當選之首位中國學者;2002年當選國際模式識別學會 Fellow,是最早獲選的幾個華人之一; 2003年當選歐洲科學院院士。徐雷曾與Judea Pearl (2011圖靈獎得主), Geoffrey Hinton(引發當下人工智能浪潮的深度學習之父)和Michael I. Jordan均有合作文章發表。1993年加入香港中文大學之前,曾在MIT的Michael I. Jordan團隊工作過一年多。早在九十年代的前五年里,就在學界最頂級的NIPS(后改名為NeurlPS)會議中發表了四篇論文,并三次擔任NIPS大中華區的聯絡人。

徐雷曾榮獲多個國內外主要獎項,如獲93年國家自然科學獎、95年國際神經網絡學會領袖獎、06年亞太神經網絡學會最高獎杰出成就獎(首位獲獎華人)。

為了解人工智能研究的歷史、現在與未來,AI報道(AI Report)拜訪了徐雷教授。這位在國際舞臺上為中國贏得聲譽的科學家對中國人工智能的發展有何看法?答案或許并不如國內AI圈中很多人想得那么樂觀。

中國人工智能發展水平距離世界頂尖還有多遠?

近年,我國人工智能發展迅猛,在企業數、發表論文數等數項指標上都已達到了世界第二。那么,中國整體人工智能發展水平距離世界頂尖水平還差多遠?

徐雷認為,要講清這個問題,最好先看一下這一波人工智能熱潮是怎樣發展起來的。

這一波人工智能熱潮起點源于2006年Geoffrey Hinton 及其學生在《神經計算》和《科學》上發表的兩篇深度學習論文,經過在學界的幾年孕育以后,引起IBM,微軟、谷歌等企業跟進推動,尤其是中國互聯網產業的蜂擁而入,才有了現在人工智能大發展的盛況。這波熱潮有下面三個主要支撐:

(1) 理論方法 Hinton在2006年的工作源頭其實是八十年代中期曾引起人工神經網絡研究熱潮的反向傳播學習算法,始于發表在1986年《自然》的一篇論文,Hinton是三位作者中間的那位。這個算法的早期影子先是回溯到1974年,后又前推到1968年。八十年代末之后的十余年,在神經網絡研究在理論、方法、和算法上都有很大發展。現今的基本家當,例如,卷積網絡、生成網絡,自編碼學習、變分學習、以及包括LSTM在內的各種遞歸網絡,大都來自于那個時期。近年來的發展主流,基本上是這些方法的應用、拓展、和各種集成,當然也有一些如GAN學習等基礎研究突破。

(2) 芯片算力 馬斯克的OpenAI 認為,2012-2017六年間AI計算力6年提升30萬倍。保守估計九十年代初到2006年的算力增長就算只有它的十分之一,那也意味著做2006年需要20分鐘算的問題,九十年代初中期要算一年。當時的基礎研究提出了各種方法,但不可能通過計算得到驗證,所以才會有一、二十年的滯后期。Hinton在1986年后的二十年再續前緣,既反映他的執著,也是歷史的圓滿。

(3) 大數據和互聯網 九十年代初采集用于語音識別的數據都已經十分困難,采集人臉圖像數據則難度更大。就算那時有算力,也不可能有足夠大量的數據來訓練,以確定深度神經網絡中的大量參數。2009年原微軟人工智能首席科學家鄧力邀請Hinton來到微軟,利用他們在語音領域積累了多年的大數據,嘗試了深度學習的應用,發現用深度學習進行語音識別比原來的識別方法成果有了很大提高。李飛飛在 CVPR 2009 上發表了關于ImageNet的論文,關注如何有效地獲取圖像數據集,并從2010 年開始開啟了每年一度的ImageNet 挑戰賽(通過互聯網和眾籌),解決了計算機視覺的大數據獲取問題。

在上述三大支撐中,第三個是我國的明顯強項。最多的人口、通訊和互聯網的飛速發展和普及、以及體制的優勢和社會的需求,語音、圖像、以及其他大數據的獲取都遠超歐美。而通過雄厚的資金投入,也購買獲得了巨大的算力,這些催生了國內許多獨角獸公司出現和飛速發展。2012年,Hinton團隊在ImageNet首次使用深度學習完勝其它團隊,神經網絡層數只有個位數。商湯的團隊在2016年ImageNet圖片分類中做出最佳性能時,用得神經網絡層數是1200多層。

語音識別和計算機視覺這兩個“耳聰目明”領域快速進入商用,這大大推動了這波人工智能浪潮在世界范圍內的高漲。與此同時,主要集中在這兩個領域,中國學者發表論文數與日俱增,國內也出現了許多獨角獸公司。從總量來看,在企業數、發表論文數等數項指標上都已達到了世界第二。甚至可以說,在刷臉場景下,已做到世界第一。

能在“耳聰目明”領域迅速發力,還和我國的文化淵源有關。徐雷說, 粗略地,人工智能可以從機器模擬“耳聰目明”、形象思維、和抽象思維三個方面來考慮。早在1975年,錢學森先生就提出,常用而重要的智能活動其實在形象思維。而那時候,人工智能界主要在研究抽象思維。

很有意思,這兩種不同方式,中國人和西方人正好各擅長其一。中國文字基本是象形的,思維發展偏重形象思維,而西方文字抽象成符號,注重關系、形式、與語法。

符號文字抽象于形象文字,故有西方有學者把抽象思維叫高級智能。自然地, AI發展的前半段就是基于符號思維,注重解析出基本單元,再按一定的規則,由底朝上逐步組合搭出一個體系。這種思維有利于抓住主要脈絡,解釋所看到的現實世界。 但是,針對“耳聰目明”這類識別認知活動,反而遇到很大困難。盡管有時被稱為初級智能, “耳聰目明”卻是思維的基礎,AI發展的前半段其實走了建“空中樓閣”的彎路。

而這次人工智能浪潮就是從“耳聰目明”這個形象思維的基礎突破的。做法很簡單,數學上完成一個X到Y的一個整體性的映射,用一個深度神經網絡結構來實現。可能由于我們的文化偏好形象思維,華人不僅參與這次推波助瀾并引起主要發展,而且也是過去一路走來致力于推動“耳聰目明”的主角之一。

早在1957年就有在美國的華人介入字符識別,70年代中期到80年代中期,是主攻“耳聰目明“的模式識別之第一個發展期,頭號領袖是美國普渡大學教授付京孫先生(1930-1985)。而徐雷的博士導師清華大學常迵院士(1917-1991)和博士后導師北京大學程民德院士(1917-1998),在上述時期則領導了中國模式識別的發展,建立了我國智能科學的第一批三個國家重點實驗室,其中兩個主攻模式識別與機器認知,并在我國學科設置上正式開出了模式識別的相關專業,近年來我國在 “耳聰目明”方面能夠人才濟濟,應當回溯到當年他們打下的根基。

中國在“耳聰目明”領域能迅速發力的現實基礎,是有大量數據、大量需求,和大量投入。影像醫療就是另一個我國依靠樣本優勢有望快速趕超的領域,僅北京腫瘤醫院一個月胃癌的門診病歷數就超過全美胃癌患者一年的門診量。中國還有不少有明顯的樣本優勢的其它應用領域,都有望能快速看到應用效益,并問鼎世界。即使如此,現在也不到聲稱中國AI在應用方面已經領先的時候。例如,在語音識別和語言翻譯方面,Google的水平優于國內企業,特別是在英文和其他文字領域更是如此。在機器人行業中,尤其是類人或特種機器人,離美國的波士頓動力機器人的水平,國內水平遠遠落后,可能差一、二十年都不止。

更令我們保持清醒的是,在三大支撐中的前兩個,我們的差距更大。

在芯片方面,設計各種專門的人工智能芯片,是可以有望很快趕上甚至超越的。但是在芯片的制造上,卻有一段很長的路要趕。而制造能力才是基礎,造不出來的設計只能是紙上談兵。在算力方面,盡管中國的神威和天河超級計算機都曾經問鼎全球,現在也仍位四甲,但在量子計算機方面,谷歌和IBM都在商用化方面推進很快。還有,在下一代計算材料和芯片方面,我國的短板可能更大。

在徐雷看來,東方文化注重集成、注重整體應用,這是一種優勢;西方注重基礎,注重造芯片,這是另一種優勢。取人之長補己之短,把別人的芯片集成過來直接使用不失為上策,東西方文化融合、互補,才能給發展人工智能帶來更好局面;只有在行不通時,才需要我們一切重新造起,這其中的關鍵是,中國必須要做到讓對方愿意賣給我們使用。

80年代初期的歷史或值得我們借鑒:當時中國要買美國的一些計算機設備,都面臨西方所謂巴黎統籌委員會對我們的掣肘。因此,中國不斷跟蹤研制,一達到一個新的水平,他們就會批準把更一高檔的設備賣給中國。可見,在產業發展時,不一定要樣樣自主做,以小得多的代價跟蹤,最優配置資源,也許更佳,但要清楚讓人知道,需要的時候,我們是有能力自己做的。

要在人工智能理論方法的基礎研究達到世界領先水平,中國也仍然是任重道遠。目前來自中國的論文,大多是在偏應用性質的會議上發表,能沖進NIPS論文不多,還達不到能在NIPS這個基礎研究的頂會上占有不可或缺的地位。大量的工作,都在追求能在中國計算機學會或其他單位自定的頂級會議上可以發表,并不追求是否能被別人大量的引用、跟隨和應用,而追求從0到1突破的努力更是鳳毛麟角。尤其令人擔憂的是,大多數大學和研究機構發出的論文,還都是通過直接用別人的開源程序計算的。

徐雷接著說,前面提到,中國人的思維是從頂向下的,忽略基礎創新,重視整體把握、應用集成,追求“短、平、快”,最后一點是尤其堪憂的。大家都離起跑線不遠時,差距還不遠,越往前差距越大。對此,他特別地提到八十年代導師常迵之問。第一次常先生問付京孫教授:“中國模式識別的研究水平離美國差多遠?”付先生答“三、四年”。而三、四年后付先生再來華訪問,常先生再問“還差幾年”, 付先生答“七、八年”。類似的故事,在基礎研究起關鍵作用的階段,其他領域也出現過。徐雷希望,這個故事不會在今后的中國人工智能發展中重演。

他還表示:“希望中國的學者中能有一部分,在這一波熱潮漸漸平穩下來、整頓盤整的期間,能慢慢沉下來,回歸到一些基礎研究。‘耳聰目明’ 的基礎研究不是中國人貢獻的,中國人的貢獻主要是快速推廣到實際應用。希望中國學者未來在形象思維、抽象思維等基礎研究領域有更多貢獻。”

在科學“奧運會”上為國摘金

上海市經信委副主任張英(左一)給中科院上海分院副院長張旭院士(左二)、同濟大學副校長蔣昌俊教授(左三)、和徐雷教授(左四)發WAIC SAIL獎的評審專家的聘書。徐雷教授在去年和今年都擔任了SAIL獎的終評會審專家。

盡管徐雷已過花甲之年,但他仍保持著高強度的工作,帶領著團隊奮戰在科研第一線。“我把一生的時間都用來拼搏了,我自認為是一個很拼的人。”徐雷這樣評價自己。這位發已斑白的老人始終保持著簡樸的生活,除了工作外,徐雷很少有別的愛好,每天從宿舍走到辦公室,晚上再走回去,就充作鍛煉身體了。

很難想象,這位聞名遐邇的科學家曾是一名煤礦工人。在恢復高考前,徐雷曾在云貴交界的一處煤礦工作。1977年,在恢復高考后的第一次招生中,徐雷走進了考場,進入哈爾濱工業大學獲得了本科學位,隨后又考入清華大學,成為常迵先生和閆平凡教授共同任導師的第一個碩士生和第一個博士生。1987年,徐雷來到北大,師從程民德院士和石青云院士做博士后,次年成為北大全校當年破格提升的十位副教授之一。

在此期間,徐雷在包括《中國科學》《科學通報》《計算機學報》《電子學報》《自動化學報》在內的國內核心刊物上發表論文18篇,在模式識別、人工智能、信號處理的主要國際會議上發表論文九篇。其中,1987年發表在UAI會議上的一篇論文最早將二值變量貝葉斯樹之學習拓廣到高斯變量,開實變量貝葉斯網學習之先。這篇論文被J.Pearl(2011年圖靈獎獲得者)收入1988年出版的經典專著中,成為了專門的一節。

還有一篇發表在國際模式識別大會ICPR上的論文,是口頭報告,因為當時外匯有限,不能出去開會。會后當時的國際模式識別學會主席 Pierre Devijver(?-1996)卻給徐雷來了一封信,說他沒有時間事先獲得許可(當時國內還沒有電郵),就主動幫徐雷代做了口頭報告。Devijver當時并不認識徐雷,也不知道是常迵的學生,那論文徐雷是單獨作者,他只是認為那篇論文應該被介紹。當今國際模式識別學會的大獎,最重要的獎項是以付京孫(K.S.Fu)命名的,而另一個主要獎項是P.Devijver獎。

1988年,在時任國家主席在北京人民大會堂主持頒獎的第一批40名霍英東獎獲得者中,徐雷是唯一的人工智能相關學科的學者。那年冬天,北大視覺與聽覺信息處理國家重點實驗室的主任石青云教授找他談,告知領導有意讓他接任做主任,該實驗室是當時國家首批智能科學相關的三個國家重點實驗室之一。此時,擺在徐雷面前的本是一個順理成章進入仕途的機會,但他毅然決然地放棄了。徐雷認為,在世界范圍內,中國的人工智能學科相關的研究離世界前沿還差的很遠,因此他選擇出國看看,與世界上最頂尖的科學家直接打交道。

談及為何做出這一選擇時,徐雷回憶道,他曾深深受到陳景潤故事的影響:1972年,蘇聯數學家代表團來訪問中國,周總理一時很為難,不知道該找哪些數學家去接待。此時代表團提出,中國有個杰出年輕數學家叫陳景潤,哥德巴赫猜想研究做出了杰出成果,希望和他談談。于是政府到處去找這個年輕人,最后在中科院一間不足6平米的鍋爐房里找到了他。陳景潤的故事激勵著那個年代的知識分子,從此徐雷立下志向,一旦國家需要,也要能為國爭光。

實際上,后來徐雷的確以中國自己培養的博士身份,在模式識別、神經網絡等人工智能領域,留下了多個中國人的印記,實現了當年的愿望。

1989年至1993年,徐雷輾轉于歐美當時相關學術領域的四個領軍團隊。1989年初徐雷加入芬蘭拉普蘭塔理工大學的E.Oja團隊做高級研究員(Oja是九十年代歐洲神經網絡領域的幾個主要學術領頭人之一),1990年春加入加拿大康考迪亞大學C.Y.Suen團隊做副研究員,也是當時加拿大模式識別領域的領軍團隊。徐雷在1991年9月以訪問學者的身份加入了哈佛的 A.Yuille 團隊(Yuille是霍金的弟子,也是計算機視覺研究領域的大師),又在一年后加入麻省理工的M. I. Jordan團隊做博士后。直到1993年秋返回中國香港,加入香港中文大學任教。

在此期間,徐雷研究著名的霍夫變換有突破性進展,發明了隨機霍夫變換RHT。他還以第一作者身份發表了另一論文,提出了分類器組合的三級框架并討論了多個組合方法, 為現在廣為研究的集成學習和信息融合提供了基礎,被廣為引用。這兩個成果使他在2002年當選國際模式識別學會 IAPR Fellow會士,成為最早獲選的幾位華人之一。

在此期間,徐雷將當時相關領域很有影響的Oja自適應PCA學習,發展到自適應非線性PCA學習;并率先揭示了Hebb學習輔以S非線性實現獨立化學習,能消除旋轉不確定性;還為Oja自適應子空間學習的全局收斂性提供了數學證明。這些成果不僅讓徐雷在該方向的影響緊隨Oja之后,而且將Oja團隊的主要興趣引回,也吸引了歐美還有中國的不少學者之后的持續推進。

在此期間,作為單獨作者,徐雷在1991年會議論文首先提出并在1993年的期刊論文中進一步闡述,提出了多層神經網絡自組織學習LMSER,以雙向對偶方式實現對網絡中參數的學習,其特點是強制了參數對稱性和神經元強度的對稱性。2006年Hinton團隊的那兩篇經典論文中的深度學習結構Stacked RBM,也強制了這種參數對稱性,而近年才出現的所謂U-net的結構,也與多層LMSER類似。由于算力的限制,當時計算實驗只做了單個隱層。但在論文中,討論和預言了多層LMSER的若干認知功能,如聯想、概念形成、心像、注意等。后面會提到,這些預言都在近年得到了計算驗證。

在此期間,徐雷還1991年提出在競爭學習中引入反壟斷機制,同時適度地引入對手懲罰機制,發明了對手懲罰競爭學習(RPCL),開創了無監督學習過程中,可以實現模型自動選擇的先河。在學習中可以自動去除多余參數,可實現選擇模型自動選擇的另一個辦法L1學習, 是1995年才出現而快速走紅的。RPCL已被直接應用于解決許多實際問題上。例如,在大數據分析和無監督統計學習中經常遇到的聚類分析中,可自動確定樣本集來自幾個不同的類。

在此期間,徐雷通過對Gaussian Mixture和Mixture of Experts 上的EM算法之收斂性做數學分析,有力支持了M. I. Jordan在九十年代倡導的EM算法的新一輪研究熱,澄清了當時統計文獻上關于EM算法的一些誤解,厘清了EM的優缺點。徐雷還與M. I. Jordan和G. Hinton合作,提出一個改進的多專家混合模型,更適合利用EM算法。

也從這期間開始,徐雷成為了當時NIPS(后改名為NeurlPS)會議上活躍的少數幾位華人學者之一。從NIPS1992起,每年一篇,連續在NIPS年會上發表了四篇論文。若看作者單位,第一篇徐雷是第一作者,單位是北京大學。其他3篇的作者單位都是香港中文大學。這意味著中國學者在NIPS發表論文的最早時間至少可提前到1992年,而不是目前國內一些資料所記載的本世紀的頭幾年。

80年代底開始,引發當下人工智能浪潮的深度學習之父G. Hinton和一批學術精英,接管了這個在1986年由IEEE信息論分會發起的學術會議。 從此NIPS成為神經網絡領域、乃至人工智能所有相關領域的旗艦會議。其后近三十年,先是G. Hinton和M. I.Jordan交替為旗手,后由他們的學生們接力,是人工智能領域,最活躍、最有創意,也是文章最難進入的會議。基礎研究成果大多先出現在NIPS,然后向其他會議,以一定的滯后期傳播和推廣應用。順便一提,從1995年起,徐雷曾連續三年擔任NIPS組委會中大中華區的聯絡人(Liaison)。

徐雷在香港中文大學二十多年期間,先是進一步發展提出了貝葉斯陰陽學習理論,發表在NIPS1995會議上,這點后面還會做介紹。然后,他一方面將貝葉斯陰陽學習理論及以上所述成果,進一步發展、完善、系統化,并在智能金融、智能醫療、雷達信號識別等領域做了許多應用工作;另一方面,在徑向基網學習、獨立子空間學習、獨立分量分析、時序獨立狀態空間、運籌優化等方向還做了不少基礎研究工作。根據資料檢索,徐雷的多個研究成果已被國內和歐美日等許多研究單位,廣泛應用于雷達、遙感、材料、機器人、無人駕駛、軟件工程、網絡發掘、精密制造、醫學圖像、生物信息等領域。

徐雷曾獲得數個國內外主要獎項和榮譽。1993年,徐雷獲國家自然科學獎。1995年,徐雷獲國際神經網絡學會領袖獎。2006年,徐雷獲亞太神經網絡學會最高獎——杰出成就獎,此獎每年僅獎一人,徐雷是榮獲此獎第三人,首兩位分別是日本智能領域的頭兩位大咖。此外,徐雷于2001年當選IEEE會士,成為中國最早的幾位會士之一,也是從計算智能學會當選的首位中國學者。2002年,徐雷當選國際模式識別學會 IAPR Fellow會士,成為最早獲選的幾位華人之一。2003年,徐雷當選歐洲科學院院士。

徐雷曾任9個國際學術期刊之編委,例如,1994起年擔任國際神經網絡權威學術期刊Neural Networks的編委達22年,是首位擔任這個角色的華人。2001年至2003年,徐雷當選國際神經網絡學會理事會理事,是中國學者最早當選的二人之一(另一位是當時的北京大學常務副校長),并任Award committee委員。2007-08年徐雷任IEEE計算智能學會Fellow committee委員,是首位華人擔任該學會此角色。他還是首位獲任 IEEE 計算智能學會會士評審委員會的華人。

徐雷于2016夏全職到崗上海交大,任致遠講席教授、人工智能研究院首席科學家、腦科學與技術中心首席科學家、張江實驗室腦與智能科技研究院神經網絡計算研究中心主任。在香港期間也一直致力于貢獻內地,為促進中國神經網絡領域的發展出力。2005年中國神經網絡學會在總結其十五年歷程時,向為該領域在中國之發展做出貢獻者,頒發了三個獎,一是給國內學者的貢獻獎, 羅沛林院士、吳佑壽院士獲獎;二是一個給外國學者的友誼獎,日本神經網絡領域頭號大咖Amari教授獲得;三是給境外華人的長期報效獎,由徐雷獲得。

面對如此豐碩的成果,徐雷卻自謙道,“我只是在科技‘奧運會’的某個項目為中國拿過獎牌,只不過就像很多優秀的運動員一樣,只能在很短一段歷史時間里做冠軍。”實際上,徐雷的領軍時間并不短暫,從90年代初之后的一、二十年里,徐雷一直是神經網絡和模式識別等人工智能領域中,中國人的一個重要代表人物。

人工智能將帶來哪些行業機會?

近年間,人工智能為多個傳統行業賦能,如醫療、金融、安防等行業都受到了深刻的影響。哪些行業更能吃到人工智能的紅利?下一個人工智能帶來的增長點又將會出現在哪里?

對此,徐雷概括,凡是涉及到視覺和語音的行業都可能被人工智能所改變。人類最主要的信息獲取渠道是視覺和聽覺,自2006年Hinton團隊的工作以來,這一波人工智能的核心突破點正是讓機器“耳聰目明”。

以語音應用為例,由于人說話快、寫字慢,很多原本需要人們耗費時間精力記錄的工作可通過語音技術轉成記錄,如醫生手術記錄、打官司寫訴狀、填表等,都是人工智能可以發揮作用的場景。視覺方面,我國對場景監控的需求越來越大,相關行業未來仍有較大增長空間。不僅如此,人類智能中最主流的信息獲取渠道就是視覺,70%左右的信息獲取來自視覺,如果一個人從小就失明,長大后智能發展必然受損。人工智能也是同理,現在人工智能發展程度相當于達到了幾歲的兒童就能達到的視覺和聽覺能力,在此基礎上開發其他應用的空間是很大的。

徐雷指出,要挖掘人工智能在視覺和語音相關領域的新應用,關鍵在于找到還未被一窩蜂涌入又有經濟增長點的場景,這就是二次創新。

盡管人工智能應用前景廣闊,但在精密制造等領域,智能化進程并不如人們預期的那么快。徐雷認為,這是由于進入專業領域的人工智能人才過少,無論是來自高校的人才還是AI初創企業都很少選擇精密制造業的緣故。這類領域需要從業者能夠同時在人工智能領域和特定專業領域具備研究水平,從業者要進入相應領域的學習成本較高,這就導致大學老師和企業雙方都沒有強烈發展AI+制造的意愿。但一旦人工智能進入制造領域,必能發揮更大的作用。

如今人工智能在醫療行業最重要的應用是醫療影像分析,也是中國有樣本優勢有望問鼎世界的領域。一來醫院已積累了大量影像片子,便于機器學習訓練;二來影像分析中人工智能的應用相對簡單,只要識別、檢索、分割和標記影像即可,需要用到的醫學專業知識較少,因此人工智能可以順利投入應用。而在醫藥開發這類需要更多專業知識的領域,人工智能與醫療的結合依然很難。懂醫的不懂AI,懂AI的人不懂醫,甚至雙方想互懂的欲望都不大,應用自然落地維艱。徐雷認為,這與評價機制有關,學者研究新領域的時間成本高,發文章慢,又難以獲得適當的評價,造成動力不足,這是AI與應用場景結合的關鍵難點。

行業機會與地方政策息息相關。談及上海人工智能產業的發展機會,徐雷對AI報道表示,從中國現狀來看,人才最集中的地區是北京,但是上海政府是布局人工智能最積極的地方政府。

一方面,從2018年起上海政府每年舉辦的世界人工智能大會WAIC,打造世界頂尖的智能合作交流平臺和行業盛會。并在大會上頒發最高榮譽SAIL獎(Super AI Leader,即“卓越人工智能引領者獎”),打造AI行業的“諾貝爾獎”,激勵全球范圍內在技術上做出方向性突破、應用創新,正在或將要改變未來生活的人工智能項目。

另一方面,在上海政府的優惠政策下,很多來自北京、深圳的人工智能企業來到上海發展,為上海帶來了大量的人才。特別是上海經信委積極建設人工智能應用基地,并在一年內連續發布了二十多個人工智能試點應用場景作為各個領域的示范,動作是相對超前的。如果上海政府能夠堅持推動下去,未來前景很可觀。另外,上海研究人工智能的力量更具備可聯合性,協同性較強。

2018年在上海舉辦的世界人工智能大會期間,多年未見的老朋友相見于黃浦江畔。從右邊起依次是Alan L. Yuille、 張旭、徐雷、鄧力。另外,左起是Michael I. Jordan和徐雷。

雙向智能應用初探

談及近兩年的研究成果,徐雷介紹,近期他正在繼續發展雙向智能,即將形象思維抽象思維和認知結合到一起,并繼續發展整體理論框架。前面提到,早在1991年提出的LMSER學習,就具備實現換臉功能的潛力,只是當時因算力所限沒有實現。但在那篇論文中,已討論和預言了多層LMSER的若干認知功能,如聯想、概念形成、心像、注意等。最近徐雷的學生,對多層Lmser進行計算,不僅驗證了早年的預言,而且發現比目前相近的自編碼和U網,性能更優越,尤其是樣本少、攻擊強的情況下。

推理是徐雷研究的又一方向。現在的知識圖譜方法反映的是信息的相關性,不能揭示因果性。在借助人工智能進行問題推斷時,找出因果關系是更有必要的。1987年時,徐雷就曾涉獵因果推理,最近在這方面又取得了較大進展。近年,中國全面啟動了新一代人工智能重大科技項目。徐雷作為負責人,帶領上海交大、清華、北大、浙大、電子科大、上科大和阿里巴巴七個單位組成的團隊,成功申請下來最近公布的首批項目之一,就是要主攻這個方向,希望能夠獲得大的突破。

此外,雙向智能還能應用于許多類似AlphaGo的場景。在人工智能領域中,AlphaGo做到的事實際上被叫做啟發式搜索和問題求解。現在很多人以為AlphaGo的成功關鍵在于蒙特卡洛樹的前瞻性搜索,但徐雷表示,這并不是AlphaGo成功的關鍵要素,在1986-1988年間,中國學者在研究啟發式搜索時就已提出過類似思路。真正的關鍵在于用深度學習網絡來看到棋盤,猶如開了“天眼”,認清了狀態并由此聯想,做到三管齊下。

徐雷總結稱,下棋和做領導是類似的,都要做三件事。第一件,是要先試幾步看一看,類似于鄧小平做深圳特區先行探路。第二件,需要有仙人指路,指出這一盤棋能不能贏,贏面是多少,這類似于大智慧者老子出面提示,起到的是堅定信心的作用。第三件,需要孫子相助,告訴從業者具體有幾種走法、走哪里是最好的策略,讓從業者選擇贏面最大的走法。下棋也好,解決任何一個問題也好,都需要三種人同時協同。AlphaGo之所以能贏,就是因為用深度學習網絡開了天眼、認了棋盤,同時做了“老子”和“孫子”。

而雙向智能的關鍵就在于形象思維認知和抽象思維相結合,雙向協同互補。過去只用抽象思維進行問題求解所遇到的困難,有望通過雙向智能獲得改進。

一般認為,AlphaGo按最低使用率計算,能耗也高達3萬瓦,是一個人腦的耗能一千倍。后來的AlphaGoZero 降到了其百分之十。我們希望運用雙向智能的耗能明顯小于AlphaGo,希望僅通過一個很小的機器就可以做到。徐雷強調:“關鍵是要追求單位能耗下的智能。”

AlphaGo和AlphaGoZero由背靠Google的DeepMind公司研發而成,此外,世界上其他的巨無霸公司也先后投入了這場研究,如騰訊已推出圍棋AI“絕藝”,日本、法國也各有自己的圍棋AI。但徐雷認為,圍棋AI不應只有擁有巨大資源的巨無霸公司能做,希望僅用普通的機器也可以與它們對弈。

雙向智能的另一優勢是魯棒性高。以刷臉應用為例,很多刷臉程序在應用時,框稍微動一下,用戶的臉就識別不出了,雙向智能方法有望改進這一困擾。

徐雷解釋道,通常的人工智能研究,要么單向地由外向內考慮識別認知,如現在大多數深度學習應用,要么單向地由內向外考慮思維與問題求解。而雙向智能是兩個方向同時考慮,認知抽象的部分被叫做陽,另一部分叫作陰,陰陽和諧進行。有趣的是,1981年諾貝爾獎獲得者羅杰·斯佩里的發現,左右腦皮質區分為左右兩邊,一部分負責邏輯、分析,一部分負責認知,雙向智能理論與這個人腦分工理論是相容的。

沿著在1991年提出Lmser的路子發展,引入概率理論,結合上面的思路, 徐雷在1995年進一步發展提出了貝葉斯陰陽學習理論。盡管陰陽的概念源自中國,在西方面臨接受度的問題,人工智能頂會NIPS在1995年會議還是接受了這個論文。它不但為許多現有統計學習主要模型提供了一個統一的框架,而且建立了一個易于計算的有限樣本下學習的新理論,可在參數學習的過程中自動完成模型選擇。上世紀末,麻省理工整理20世紀腦科學和神經網絡重要貢獻,出版經典匯集《腦理論和神經網絡方法》時,貝葉斯陰陽學習理論也被收納其中。

AI新挑戰無可回避

人工智能蓬勃發展的同時,也帶來了一系列新的挑戰。

倫理方面,面臨最大爭議的研究領域是“增強智能”,特斯拉CEO埃隆·馬斯克正在研究的腦后插管就是一個代表性例子。“增強智能”旨在將人腦與機器直接連接,讓人能夠通過腦電波直接控制機器進行交流。這部分研究對殘疾人是有意義的,但也提出了重大的倫理挑戰:這一類人與機器的結合體是否依然能被稱作人類?

人工智能還可能帶來更為直觀的危險。比如,國外有人做出蝴蝶或蜻蜓大小的飛行器,攜帶著烈性炸藥,通過人臉識別技術尋找特定對象并炸穿面部實施謀殺。目前,有3000多名人工智能從業者聯合簽名阻止上述研究,但以現有技術做出這類“殺手機器人”已不成問題。

更重要的是,人工智能減少人的勞動,將導致失業問題。隨著人工智能逐漸替代人的勞動崗位,用工成本漸低,未來財富很可能越來越集中到幾個寡頭手里,其他人卻越來越貧窮。而人的本性決定,大資本家掙錢后不會拿出來與普通百姓共享。

不過,失業問題并非完全無解。徐雷認為,人工智能不斷改變人類的生活形態,將造就行業洗牌的機會,舊的行業倒下后,也可能洗出新的領域。核心問題在于如何創造出新的生活方式,在某個領域的從業者批量失業的同時,怎樣讓新的行業吸收倒下的行業。徐雷將該過程比作小孩搭積木,“現在有一些積木塊,我們用它搭出一個世界;后來有一天,小孩玩這個積木玩煩了,希望搭出新的一堆積木,拆拆搭搭總有事干。”只是,人類的需求并非無限增長,因此新行業的創造存在極限。對此,徐雷寄希望于政府進行統一管理,強有力地從頂層解決最關鍵的分配問題,才有可能達到人工智能為勞動者減負而不導致失業潮的狀態。

最后,徐雷談到了人工智能發展可能帶來人類抽象思維能力下降的問題。現代計算機在西方智能高度抽象的基礎上建立而成,在計算機替代人類完成很多抽象思維工作后,人類的相應能力就得不到鍛煉。這意味著人類不只是工作在被替代,連思維能力也在被代勞的過程中逐步減退。

    猜你喜歡

    0條評論

    發表

    請遵守用戶 評論公約

    類似文章
    喜歡該文的人也喜歡 更多

    龙的财富APP下载
    友玩广西棋牌代理后台 微乐家乡麻将下载 3分赛车开奖记录 涨停后股票操作 辽宁快乐12基本走 安徽安庆麻将打法 股票上市规则 腾讯欢乐麻将大众麻将胡法 欢乐大众麻将手机版下载 北京十一选五开奖号 3d预测专家直选推荐 奥运会排球比分规则 今天股市大盘分析 闲来江西麻将怎么下载 福彩29选7一等奖 安徽麻将外挂