(相關(guān)資料圖)
在2023年的世界人工智能大會(huì )(WAIC)上,大模型“扎堆”。根據大會(huì )主辦方此前發(fā)布的內容,這次大會(huì )上有30多個(gè)海內外大模型登場(chǎng),開(kāi)發(fā)團隊或是分享大模型路徑,或是展示大模型賦能各行各業(yè)的多元生態(tài),都爭相在大模型發(fā)展上有所行動(dòng)或謀得先機。
如“雨后春筍”般出現的大模型,究竟改變了什么?
它讓“專(zhuān)業(yè)門(mén)檻”變低
一個(gè)初學(xué)者如果學(xué)畫(huà)畫(huà),可能需要練個(gè)幾年,才能畫(huà)出一幅足夠專(zhuān)業(yè)的畫(huà)。
人工智能改變了這一情況。它讓畫(huà)畫(huà)的“專(zhuān)業(yè)門(mén)檻”變低,僅僅輸入一些文字,一幅美輪美奐的作品便在短時(shí)間里生成了。
在大會(huì )的一場(chǎng)論壇上,商湯科技董事長(cháng)兼CEO徐立在生成式大模型“商湯秒畫(huà)SenseMirage3.0”上輸入一些提示詞:中國龍、藍色擺件、珠寶風(fēng)格。
看似簡(jiǎn)單,但徐立說(shuō),該大模型可以根據大眾認知,自動(dòng)“補齊”提示詞,讓生成的圖片細節更豐富。
在“補齊”提示詞后,該大模型呈現的是:一張中國龍3D渲染圖,具有精細的圖案。龍站在一片藍色“瑪瑙?!鄙?,增添了深度和神秘感……
7月6日至8日,2023世界人工智能大會(huì )在上海舉辦?!∴崿摤?攝它讓“數據家族”發(fā)生改變
因為數據安全問(wèn)題,很多企業(yè)不敢讓數據“流通”起來(lái)。
大模型下,“數據家族”悄然發(fā)生變化。
星環(huán)科技創(chuàng )始人、CEO孫元浩認為,運用大模型對數據進(jìn)行分類(lèi)分級,可能是個(gè)新嘗試。
他認為,大模型用的數據可以分為四類(lèi):第一類(lèi)是感知類(lèi)數據,如視覺(jué)數據、語(yǔ)音數據等。第二類(lèi)是事實(shí)類(lèi)數據,過(guò)去很多行業(yè)已經(jīng)能將這類(lèi)數據結構化,但需要借助大模型將其變化歷史找出來(lái),組成完整語(yǔ)義;第三類(lèi)是知識類(lèi)數據,過(guò)去很多這類(lèi)數據并沒(méi)有被有效利用,大模型出現以后有望助力改變這一情況;第四類(lèi)數據是方法論類(lèi)數據。
孫元浩說(shuō),從感知類(lèi)、事實(shí)類(lèi)、知識類(lèi)到方法論類(lèi),所有的數據向大模型輸入時(shí)都需要轉化為大模型能理解的語(yǔ)言,因此“大模型時(shí)代”,數據產(chǎn)業(yè)鏈需要各種工具以及各種類(lèi)型的數據庫,這樣才能真正把大模型用起來(lái)。
它讓產(chǎn)業(yè)變“活”
大模型改變了什么?這對致力于搭“數據樂(lè )高”的數庫科技創(chuàng )始人兼CEO劉彥來(lái)說(shuō),并不難回答。
他的團隊把SAM(Segment Analysis& Mapping)產(chǎn)業(yè)鏈數據體系升級為UPG(Universal Product Graph)產(chǎn)業(yè)鏈數據體系,“UPG不但有SAM的框架,同時(shí)它可以疊加工藝、生產(chǎn)環(huán)節、材質(zhì)、設備等各種類(lèi)型的關(guān)系?!?/p>
換句話(huà)說(shuō),大模型的出現,讓該企業(yè)搭“數字樂(lè )高”的能力更強了。
劉彥說(shuō),原來(lái)要“提煉”這些關(guān)系很難,大語(yǔ)言模型可以跑海量數據、快速生成這些關(guān)系,大大提高了效率。
螳螂捕蟬,黃雀在后。當大模型“運動(dòng)員”越來(lái)越多的時(shí)候,大模型“考官”出現了。
今年的世界人工智能大會(huì )上,作為“鎮館之寶”之一,“蟻鑒AI安全檢測平臺2.0”(簡(jiǎn)稱(chēng):蟻鑒2.0)受到關(guān)注。螞蟻集團大安全事業(yè)群技術(shù)部總裁李俊奎表示,“生成式大模型是一種‘深黑盒’技術(shù),‘蟻鑒2.0’很像一個(gè)24小時(shí)不眠不休的‘安全黑客’,致力于找出大模型存在的弱點(diǎn)和安全問(wèn)題。這種AI對AI的評測,好比‘生成式考官’考核‘生成式運動(dòng)員’,也是教學(xué)相長(cháng)?!?/p>7月6日至8日,2023世界人工智能大會(huì )在上海舉辦?!珡┛?攝
它讓“智能未來(lái)”更具挑戰
大模型有了,大模型下的“智能世界2.0”就能來(lái)了嗎?
還沒(méi)有。生成式大模型,以概率的方式生成內容,會(huì )生成似是而非的內容,這也被稱(chēng)為“幻覺(jué)問(wèn)題”。
如何讓語(yǔ)料更精準、讓大模型減少“幻覺(jué)問(wèn)題”,業(yè)界在努力。
上海數據交易所總經(jīng)理湯奇峰在大會(huì )上稱(chēng),大模型建設中,語(yǔ)料庫是一個(gè)非常重要的方面。上海數據交易所致力于建設高質(zhì)量的語(yǔ)料庫,推動(dòng)人工智能大模型產(chǎn)業(yè)的發(fā)展。
在今年的世界人工智能大會(huì )上,中國電信發(fā)布行業(yè)大模型Telechat。據中國電信數字智能科技分公司副總經(jīng)理何忠江介紹,Telechat依托中國電信云網(wǎng)融合優(yōu)勢,利用自研技術(shù)增強大模型的預訓練和推理能力,減少大模型“幻覺(jué)現象”;同時(shí),Telechat大模型正在與千行百業(yè)的信息化解決方案進(jìn)行融合,以滿(mǎn)足多樣場(chǎng)景需求。(完)