(資料圖片)
在發布智腦視覺大模型不到半個月后,三六零(601360)又在6月13日,發布其智腦大模型4.0版本,其特點是多模態、全端應用、數字人。
在發布會現場,三六零董事長周鴻祎認為,大模型至少有10年紅利期;對個人和企業來說,數字人是未來人工智能大模型最合適的入口。
在周鴻祎看來,大模型的安全問題超越了內容安全,應該訓練另一個GPT來監督GPT;未來如果只講發展不講安全,該大模型會走不遠。據其透露,360已啟動了安全團隊在人工智能安全上的研究,首創了一個大模型安全風險的評估體系AISE,下一步將會公布。
6月13日上午,三六零股價大漲超9%,但午后逐漸回落,最終以5.49%的漲幅收盤,目前市值為1099億。
已趕上國際平均水平大模型至少有10年紅利期在發布會現場,與會者普遍感覺到,周鴻祎明顯變瘦了。對于國內大模型的發展水平,周鴻祎表示,“國內現在(AI大模型)你追我趕,不斷相互激勵,縮小和全球領先技術的距離。原來我說(差距)有一年半、兩年,我今天收回這句話。我認為國內現在這種發展迭代速度,已經基本趕上或者接近國際平均水平。”對于如何做大模型,周鴻祎認為,現在不應該只是拘泥于做很多通用的基礎能力,而應該想一想,如何把大模型做成真正像電一樣,能夠輸送到百行千業、千家萬戶、千千萬萬企業,輸送到億萬個辦公一族身邊,這樣才能產生工業級革命的力量。“大模型就像發電場一樣,通過訓練大數據,直接產生了電力,可以把通用的人工智能能力直接輸送給每個行業和企業,把石油加工成電,這就產生了未來5-10年新的工業革命的機會。”在周鴻祎看來,今天大模型的價值,不僅僅在于ChatGPT的使用量,以及一些互聯網場景的結合,更在于未來把大模型這種人工智能的能力垂直化、產業化、企業化、個人化,“這樣的產業機會剛剛開始,未來至少有10年的紅利期”。據其介紹,谷歌發布的大模型策略中,有四種大小尺寸不一樣的大模型。Facebook發布的以“LLaMA羊駝”為首的開源大模型里面,有一種方式是把大模型越做越大,參數越大,訓練的語料越大。但還有一種方式,是把大模型做小,即把它用在垂直領域,讓甚至可以安裝在一臺電腦或者手機上。如果能裝在手機上,就意味著大模型將來可以部署在邊緣技術設備,甚至部署在IoT設備上。因此,在“做大”的同時,大模型還有一個“做小”的方向。“應該自己抽自己幾耳光”在周鴻祎看來,大模型的難度已經不在于模型,模型有很多選擇,算法基本上都是公開的。“今天的挑戰在于,用什么樣的數據做預訓練,用什么樣的題海戰術做有監督的微調。最后還有一個很重要的,就是這模型必須要在互聯網上找到用戶使用,因為用戶的使用他想到了各種例子,遠遠超越我們自己內部的測試。”因此,周鴻祎認為,今天訓練大模型應該說不難,其壁壘在于數據、用戶標注、答題的標注,以及用戶的使用反饋。談到此處時,周鴻祎突然表示了深刻的反省:“當然說起來也很慚愧,講這一頁的時候,我覺得我們做搜索的公司都應該自己抽自己幾耳光。”實際上,搜索公司都在發展大模型技術,無論是Bing、百度,還是谷歌。2018年,谷歌發布了BERT算法,360當時就進行了跟蹤和使用,后來包括T5和GPT這幾個版本,360也進行了研究和跟進。我們確實缺乏OpenAI的這種精神,他們這些人對通用人工智能有一種執念,他們夢想把人類所有的知識訓到一個大模型里面,而且堅定地走只有解碼器的路線。其他的公司雖然也都用大模型,我們就比較雞賊地用大模型解決很多現實的問題,比如廣告點擊率高一點,推薦的內容好看一點,給你推薦的視頻讓你欲罷不能,大家都忙著做跟現實場景的結合。用GPT監督GPT人工智能是一把雙刃劍,大模型本身也會有漏洞,會被人利用。業內普遍認為,發展大模型的三大要素是算力、算法、數據,但周鴻祎認為應該改成算力、數據和訓練,而且還應加上“安全”。“不管在哪一個國家做大模型和生成式AI,都要保證輸出的內容不能違背當地的法律法規,要符合當地的道德習俗。原來我認為這是Mission Impossible(不可能完成的任務),但在工程人員的研究下,我們找到了一個突破。怎么保證GPT不說錯話?答案是訓練另外一個GPT來監督這個GPT。”周鴻祎表示。在周鴻祎看來,大模型的安全問題超越了內容安全,還有更多內涵。“大模型可以讓一個小白變成專家,也能讓一個很低水平的、原來當不了黑客的人,變成能寫攻擊代碼、釣魚郵件、研究系統漏洞的壞家伙,使得干壞事的成本降低了很多。”據其透露,360已經啟動了安全團隊在人工智能安全上的研究,首創了一個大模型安全風險的評估體系AISE,下一步將會公布。而在6月10日的北京智源大會上,OpenAI聯合創始人、CEO薩姆·奧特曼(Sam Altman)當時在演講中表示,“AI安全是最新的技術,需要思考關鍵的AI安全問題,需要構建安全的分類器和檢測器,以監測符合用戶政策的情況,這一點很重要。”薩姆·奧特曼當時稱,應該推動并引導與安全研究一致的投資。他當時表示,正在投資幾個新的且有望能取得成果的方向,其中之一是可擴展的監督,嘗試使用AI系統來協助人類監督其他AI系統。“未來如果只講發展不講安全,這個大模型是走不遠的。我們把安全能力和大模型的研發結合起來,一方面用安全加強大模型的能力,另外一方面用安全使大模型更加可控。”周鴻祎強調。對此,一位業內資深人士對記者表示,這個方向是對的,因為人工智能的能力一般人監管不過來,一定是以其人之道還治其人之身,訓練一個能夠監管人工智能的人工智能,或者用智能更高的人工智能監管智能水平低的人工智能,如用GPT5來監管GPT4。大模型又迎發布潮聚焦應用產品大規模升級上線2023年4月,中國移動研究院發布了《我國人工智能大模型發展動態》。報告顯示,國內大模型整體與GPT3.0性能相當,百度、騰訊、阿里、華為等處于第一梯隊。從大模型的布局體系來看,科技大廠在算力層、平臺層、模型層、應用層進行了四位一體的全面布局。百度、阿里、華為三家均從芯片到應用進行自主研發的全面布局,如百度的“昆侖芯+飛槳平臺+文心大模型+行業應用”、阿里的“含光800芯片+M6-OFA 底座+通義大模型+行業應用”、華為的“昇騰芯片+MindSpore 框架+盤古大模型+行業應用”。從大模型參數量看,科技大廠的參數量遠大于科研院所。2023年5月,科技部直屬的中國科技信息研究所在中關村論壇發布《中國人工智能大模型地圖研究報告》。據該報告不完全統計,截至目前,參數在10億規模以上的大模型全國已發布了79個。其中,科技大廠的大模型參數量較大:阿里通義千問大模型參數在10萬億級以上、騰訊混元大模型和華為盤古大模型參數量均在萬億級以上、百度文心一言大模型參數量在2千億級以上、京東言犀大模型的參數量為千億級;垂直行業科技企業已經上線的參數量普遍在千億級以上;而科研院校大模型的參數量在千億級及以下。民生證券研究院計算機團隊認為,在經歷二月至三月的大模型集中發布期、四月至五月的產品研發期和政策方向逐步明確后,六月起,人工智能大模型產品和應用有望迎來集中發布。但是,不同于二三月份的純粹大模型發布,新一輪發布潮,是基于大模型的應用產品開始大規模升級上線,為走進千家萬戶做準備。從相關企業的情況來看,在科大訊飛、三六零之后,6月16日,華為人工智能框架生態峰會也將在上海召開,舉辦“上海昇思AI框架&大模型創新中心啟動暨伙伴入駐儀式”,以共建AI開源生態。關鍵詞: