先是CEO納德拉對微軟大動干戈的進行了重組,將
西安高清監控 西安監控系統 西安監控軟件 西安監控監控系統 西安海康監控 西安高清大華監控 西安三星監控 西安監控管理軟禁 西安監控監控軟件 西安大華紅外監控監控系統 西安IC卡 西安ID卡
原Windows部門重組成“設備與體驗”和“云計算與人工智能平臺”。很快谷歌也宣布將原來的人工智能及搜索部門一分為二,將人工智能部分獨立出來,歸由原來谷歌大腦的負責人Jeff Dean領導。很快蘋果又挖角了谷歌前人工智能及搜索部門主管John Giannandrea,任命其領導機器學習和人工智能戰略并直接向Tim Cook匯報。
對于AI行業來說,這顯然是好消息。谷歌和微軟一樣,原本將AI與自身最核心的業務歸攏在一起,如今將兩者區分開來,無疑是一種提升對AI重視程度的表現。未來的風向或許是,深度學習不再是某一項業務的衍生品或附庸,甩掉原生根系的糾纏,走向獨立發展、高頻競爭的快車道時代。
而在整個AI快道比拼當中,硬件算力、數據算法等等元素無一不處于白熱化的競賽之中,幾乎每天都有新的論文、新的產品問世??呻[藏在快道底層的,卻是一個極易被忽視,但卻實際至關重要的問題——深度學習開發框架。
每位AI開發者每天都會使用它,可外界對它的關注卻少之又少。但深度學習開發框架絕非一灘死水,悄然之中谷歌、Facebook、百度三大AI玩家,正在圍繞深度學習框架展開一場新的“三國殺”。
AI要沖:深度學習正在變成一件更專注、更系統的事
在谷歌原來的業務結構中,谷歌大腦本是一個偏重于研究的團隊,在深度學習、NLP、CV等等領域的國際期刊和學術上發表了大量論文,并且將開發框架TensorFlow歸攏到自己旗下。
隨著近一兩年間AI相關技術的應用性增強,谷歌大腦的上述研究結果也開始有機會進一步投入產業。谷歌這一次提升AI業務的重要性,或許是在謀劃AI業務獨立開發和系統性業務布局的可能——AI與工業、AI醫療影像……當技術前景越來越廣闊時,就進一步展現出了深度學習開發框架在產業關系中的戰略要沖地位。深度學習開發框架可以圈定開發者和應用,從而釋放谷歌在AI方面的技術能力和未來TPU的計算能力。
巨頭們紛紛開始調整架構,意味著深度學習正在走向系統化和專注化,這以數據、感知與運算的深度纏繞的產業領域,開發以及開發者生態自然成為了產業活躍度的基石,有關開發生態的競爭則直接體現在了深度學習開發框架的發展中。
比如,Facebook就不愿讓谷歌獨享深度學習開發平臺帶來生態收益,在去年年初推出了針對意味十足的開發平臺PyTorch。并且在去年9月聯手微軟旗下的CNTK和Caffe2,推出了一套開放的神經網絡交換格式,為的是在谷歌生態愈發封閉時,提升場內其他選手之間框架格式的互通性。
而在中國,百度的PaddlePaddle也在不斷發展,憑借本土化特色吸引了國內的開發者,綜合GitHub pull request的數據來看,PaddlePaddle已經成為了全球開發熱度增速最高的開源深度學習平臺。同時隨著百度在斯坦福、加州伯克利等海外高校頻繁開展技術交流活動,PaddlePaddle甚至在逐步走向世界舞臺。
不知不覺間,這三大科技巨頭專屬的深度學習框架,正在展開一場新的三強爭霸。
降低一切門檻:開發框架三國殺在爭什么?
在我們談論AI開發時,我們就究竟在談論什么?
·更多的開發者:開發者數量顯然是一切的前提,數量廣闊的開發者就像蒲公英的種子,會把深度學習開發框架以及相關的軟硬件服務帶到各個企業中去,幫助巨頭們的AI布局在四處扎根生長。
·更活躍的開發生態:建立在大量開發者數量之上,用案例和經驗對開發社區進行填充,鼓勵開源和共享,讓AI的開發變得更加簡單,從而進入更多行業和場景。
·更高級別的開發項目:自身框架中誕生一款殺手級應用,可能是每個巨頭都會有的理想目標。高價值和高效用的應用AI很可能帶來大量簇擁者,一齊涌向該框架的生態之中。
總之,如何降低門檻以一切手段吸引開發者進入,成為了三大開發框架的共同目標。
最典型的例子就是TensorFlow與PyTorch之間的競爭。
在目前的開發框架中,TensorFlow憑借著谷歌的技術優勢一直表現的較為強勢,在開發者越來越多時,其開發社區生態也在進行良性發展。
但占據了優勢后,TensorFlow開始隨著谷歌一同收攏自身的開發生態。比如谷歌曾經推出過一系列賦能開發者的培訓計劃,向開發者提供課程教學。但結果是所有的教學全部都建立在TensorFlow之上,所提供的硬件API也只能接入TensorFlow,而TensorFlow的社區資源和開發工具更新,又部署在谷歌云之上。并且TensorFlow在最近單方面和Caffe等開發平臺“友盡”,使得開發者們無法進行平臺之間的遷移。
而Facebook就抓住了這一點。將原來的開發工具Torch進行升級,聯手微軟打造神經網絡交換格式幫助開發者降低遷移成本。同時PyTorch設計了更方便的數據加載API接口,使開發過程中加載并行數據更加順暢,相比TensorFlow降低了不少API方面的學習成本。
在自定義擴展上,PyTorch也改變了TensorFlow依靠樣板代碼才能實現的情況,通過為CPU/GPU編寫接口這種更易行的方式添加自定義拓展,使得開發過程中的自由度大大提高。
綜合來看,在開發框架的競爭中,賽點在于更低的學習成本和遷移成本,以及更高的易用性和社區友好度。
在這幾個方面,西方戰場之外的PaddlePaddle也以靈活、易用著稱。在訓練部分的調用方式上集中了瀏覽器和客戶端等多種主流調用方式,并支持CPU、GPU、FPGA等多種硬件,從而極力降低開發成本。同時為了讓更多開發者和企業能夠將現有項目接入到中PaddlePaddle,PaddlePaddle做到了從基礎訓練到分布架構徹底開源。百度爭奪開發者的決心可見一斑。
當然在中國市場范圍來看,PaddlePaddle最大的優勢還是擁有唯一提供適用中文文檔與數據集的開發框架社區。中國市場作為區別于歐美世界之外的獨立極,坐擁龐大的中國AI產業與開發集群,這些產業和開發者都需要適用于本土的經驗體系,也自然會被PaddlePaddle的社區氛圍吸引。
關注未來紅利:貿易戰帶來的中美AI對標新命題
在理想狀態下,通過開發框架牢牢把控開發者體系,在自身平臺上不斷產生生態效應,收割未來必然出現的AI時代現象級產品與應用,這一流程才是巨頭們所關注的目標。
同時我們要知道,所謂的把現象級產品和應用放到AI這一定語之下,就意味著這些應用可能與社交媒體聯系,關乎著我們的輿情數據,也可能與自動駕駛聯系,關乎著每一輛汽車的行駛路線。
在這時我們不得不提出另一個可能,在中美貿易戰的大背景下,中國AI開發群體,尤其是AI企業,使用TensorFlow等平臺的風險指數正在提升。
就拿美國向全球提供免費GPS技術來說,曾經很多國家甚至在軍用設施上也利用GPS進行定位技術,但在99年印巴戰勝時,美國出于利益直接關閉了印巴地區所有的GPS服務。想象一下,兩軍交戰之時,忽然所有人都不知道自己的位置信息,這是一件多么恐怖的事情?如今TensorFlow早已不再是單純的開發框架,而關系著技術、云服務等等多種模塊。如果同樣的狀況復制到AI上,如果有一天深度學習模型已經埋藏在我們生活作業的種種細節深處,谷歌卻因為種種原因停止向中國提供云服務,我們連遷移模型都十分被動。
而最近因中美貿易戰引起的芯片事件,似乎為中國整個科技產業都敲響了警鐘。
對于AI更是如此,如果我們可以建立完全本土化的開發框架和社區,連接在地化的數據、計算服務和技術,中國AI也就可以實現由開發到技術創新,再到產業模塊與商業化的完全自生態流程。
雖然在經濟全球化發展的大背景之下,沒有任何一個國家可以完全依賴自身發展科技。但在全球對弈的牌局中,為自己加碼也一定是一項不會出錯的選擇。