“你看,我只需要一個指令,就能獲取青島市近十年來的GDP數據,并且自動繪成圖表,為我生成分析報告?!痹谇鄭u大學科學技術學院教授孫仁誠的辦公室里,他頗有興致地向記者展示著團隊研發的技術成果。這類成果正是2023年以來風生水起的人工智能大模型(以下簡稱大模型)。
很少有一項技術像大模型這樣,盡管已在全球“熱”了快兩年,但仍然不斷涌現新熱點。孫仁誠表示,大模型像當初的互聯網技術一樣,催生著新一輪技術創新與產業變革?!爱斍笆袌鲆曰A大模型為主,如何將大模型融入千行百業,是下一階段的發展重點?!?/p>
2024年5月底,在青島市算力發展大會上,青島市工業和信息化局發布的《青島市人工智能產業創新發展行動計劃(2024—2026)》提出:青島將實施算力設施“強基”、算法模型“鑄魂”、數據要素“提質”、核心產業“固鏈”、創新平臺“領航”、產業生態“聚力”、場景應用“賦能”七大行動,將大模型作為重點推進方向。
5月28日,海創匯旗下創投智能交互服務品牌鯨準與阿里云聯合,在創業服務行業率先發布了創投大模型“鯨準小鯨AI”;6月21日,國家互聯網信息辦公室發布第六批境內深度合成服務算法備案信息,海信視像科技股份有限公司推出的海信星海通用文生圖算法在列。
山東省工業和信息化廳于6月13日印發的《關于加快大模型產業高質量發展的指導意見》提出,加快突破一批前瞻性、原創性、引領性大模型關鍵技術,打造具有一定國際影響力的基礎級大模型,在重點領域和關鍵環節培育一批覆蓋范圍廣、產品能效高的行業級大模型、場景級大模型。
目前,青島重點研發的大模型產品已經超過了20個,城市形成了以嶗山區人工智能產業園為主承載區,西海岸新區光谷軟件園、市南元宇宙產業創新園、市北浪潮大數據產業園、城陽數據要素產業園和青島高新區機器人產業集聚區為特色承載區的大模型產業發展格局。
價值:“不得不用”大模型
就像是汽車替代馬車,電子表格取代手動記賬。
同樣地,在這樣一個AI技術加速迭代的階段,每一個個體,每一家公司或者機構都面臨著該如何用好AI的必答題。
大模型的強大之處在于賦能千行百業,它既可以通過深度互動掌握專業領域知識,又可以作為通用模型廣泛應用于日常。
“未來每個人都能擁有定制數字人,數字人背后是人工智能大語言模型,它將以一種更加擬人化、個性化的方式為人們提供娛樂和工作服務?!鄙綎|云管家數據科技有限公司副總經理綦俊杰給記者演示釘釘AI能力及場景時,用了10分鐘時間給記者建立了一個新的“AI數字員工”。
“AI數字員工是虛擬員工,能以企業員工助手的身份,進入企業通訊錄,取得對應的職務權限,參與到企業的組織管理和業務協同中。作為企業員工的有力輔助,數字員工能夠協助企業員工完成枯燥重復的程序化工作,讓他們將更多精力用于創造性工作。”綦俊杰告訴記者,他每天到公司的第一件事,就是打開電腦,讓AI助理協助瀏覽釘釘群的消息形成智能摘要及待辦,發揮銷售管理的BI數據、釘釘文檔內容生成、視頻會議語音轉文字的自動概要、“AI文檔速讀”等功能,大模型讓他的工作效率得到全面提升。
“目前,釘釘AI助理中大部分功能是免費的?!濒肟〗軐τ浾弑硎?,在免費功能之外,利用釘釘低代碼平臺宜搭,應用生成AI助理等適合中小企業使用的功能收費也不高。大模型依托低代碼“小、輕、快、準”的特性,將觸角伸到了萬千真實業務場景里,這顯然符合青島中小企業對大模型應用產品的需求。
2024年是大模型席卷全球的第二年,中國的大模型價格戰打響。5月份,字節跳動宣布,豆包主力模型在企業市場的定價只有0.0008元/千Tokens,比行業便宜99.3%。阿里云對標GPT—4的商業化模型Qwen—Long的API輸入價格降至0.0005元/千Tokens,直降97%。百度、騰訊、智譜AI、科大訊飛等一眾頭部企業紛紛跟進。
阿里云公共云事業部區域總經理李成龍表示,對于中小企業來說,大降價帶來的接近“免費”的大模型調用成本,讓很多中小企業更愿意先把系統“跑起來”試試,創新成本降低、創新熱情提升。
“我認為大模型使用越早,可能收益越好?!痹谇鄭u市人工智能產業協會秘書長姜代楠看來,大模型產品可以在產品設計、生產線的工藝優化、生產的質檢環節等方面降低企業成本,有望讓每個人、每個團隊、每個企業、每個行業真正地提高勞動生產率。
海創匯利用創投大模型“鯨準小鯨AI”,為用戶提供高效、準確、個性化的投融資咨詢服務。
青島算力設施建設進展迅速,阿里云、騰訊云、華為云等相關算力企業均在青島加快布局。
基礎:讓數據為底
AI發展,尤其是大模型的發展離不開海量數據的累積與深度學習。孫仁誠認為,大模型的基礎就是數據,有了數據才能談到模型開發和算力。
數據,就是大模型進一步發展的先決條件。
青島在數據開發利用方面,可謂“數滿質高”—數據體量大、質量高,并在數據資源化、數據資產化、數據產業化等方面走在了全國的前列。
6月13日,在青島市數據要素供需對接會上,青島市大數據發展管理局局長張艷介紹,當前,青島公共數據開發利用的資源池已匯聚高點視頻、物聯感知等高質量公共數據總量3180TB,包括1.3萬個可共享數據集;自1998年以來的全市電子文件信息10.3億件;電子病歷、健康檔案等高質量健康醫療數據41億條;機場、地鐵、港口、公路等交通運輸數據資源2160億條。
青島市大數據發展管理局副局長王朝靜告訴記者,2022年青島市就開始了公共數據運營試點工作,開發了一定數量的公共數據運營場景,在交通、教育、醫療、海洋等都有了一些應用場景典型案例。例如,青島市在全國率先成立數據資產登記評價中心。隨著數據要素資源的不斷集聚,青島在本次數據要素供需對接會首次提出“以數招商”的概念,對公共數據資源、社會數據資源進行統一的摸底,與全國的數商企業進行合作,共同打造更優質的大模型應用產品。
王朝靜表示,下一步,青島市大數據發展管理局將統籌全市數據資源,推動公共數據和社會數據按需匯聚有序供給,探索企業數據資產化新路徑和交易運作的新機制,鼓勵企業開展數據采集、清洗、標注、質檢等業務,構建大數據產品供應和交易服務市場。
2024年年初,國家數據局等17部門聯合印發的《“數據要素x”三年行動計劃(2024—2026年)》進一步明確“建設高質量語料庫和基礎科學數據集,支持開展人工智能大模型開發和訓練”。通過數據要素建設推動人工智能大模型發展,可以有效突破人工智能研發,特別是大模型研發所面臨的數據瓶頸,進一步發揮大模型匯集和處理世界知識數據的能力,從而創造更大的生產力,助力中國從數據經濟走向智能經濟新發展模式。
青島在數據開放上的魄力和進度,以及在挖掘數據要素價值方面的創新機制,為企業挖掘數據應用場景、開展深層次合作提供了廣闊的市場空間。
優勢:產業與算力
數據是基礎,但如何實現應用才是重頭戲。
“對于大模型,我們不能只把自己看作使用者。特別從青島市的層面講,還是要思考如何深入其中,創造一些展現青島優勢的大模型產品?!睂O仁誠表示,目前市場上較為知名的大模型產品,基本是以ChatGPT、通義千問、文心一言為代表的基礎大模型或者通用大模型?!斑@些產品最大的特點就是背后擁有海量的數據,能服務于各行各業,如果僅從‘通用’角度出發,青島顯然是不具備競爭力的?!?/p>
那么青島發展大模型的優勢在何處?在孫仁誠看來,一是產業,二是算力。
“大模型要真正產生價值,最后一定要和企業、行業背后的數據緊密結合,就像使用搜索引擎一樣,搜索出的結果本身價值有限,但將它們應用到具體的場景后,這些結果才能說有了價值?!睂O仁誠說道。
青島的產業優勢不言而喻,海爾、海信、青島啤酒這些行業巨頭的存在,讓青島在制造業賽道上脫穎而出。也得益于這種制造優勢,青島的大模型機遇就體現在“產業大模型”身上。
“產業大模型其實就是在基礎大模型、通用大模型的基礎上,利用它們的數據,更加精準、垂直地應用在特定領域,為領域內相關的企業提供服務。”鯨準數據院負責人張文政告訴記者。
以海爾集團旗下海創匯平臺推出的“鯨準小鯨AI”為例,該產品專注于投融資領域,致力于為用戶提供高效、準確、個性化的投融資咨詢服務。在這個創投大模型背后,是海創匯積累的超106萬家創業企業、5萬余位認證投資人、200多家高校科研機構以及超過10萬家服務機構,這些資源形成了鯨準獨有的創業大數據、項目大數據、投資人大數據和行業大數據的數據庫,能夠精準地服務創業者、投資人、行業分析師以及投資機構等創投領域的相關用戶。
“我們之所以可以打造產業大模型,歸根結底是因為擁有海爾這樣的行業領軍企業,足夠了解市場,也擁有足夠的體量?!睆埼恼⒑?、海信、青啤這些企業比作圓心,在它們的“圈子”里有數以萬計的攸關方,而“圓心”們打造的大模型產品幾乎具備一呼百應的能力,誰與之相關,誰就能獲得精準的大模型賦能。
聚焦算力,青島同樣有深厚的積淀。
天眼查最新數據顯示,中國現存378.42萬家算力基礎設施相關企業,北京、廣東、山東分別列區域前三名。其中,青島與算力基礎設施相關的企業達4.9萬家。
特別是近兩年,青島算力設施建設進展迅速,移動、聯通、電信等運營商,以及包括阿里云、騰訊云、華為云、京東云、微軟云、亞馬遜、鵬博士等相關算力企業均在青島加快布局。中國聯通(青島)智算中心和中國移動智算中心(青島)在內的5家算力中心已相繼啟用。目前,青島已建成由神威國產超算、X86超算、GPU和大數據存儲四大集群構成的超大規?;旌纤懔ζ脚_,算力規模處于國內頭部方陣,形成了國內支持人工智能大模型訓練規模最大、性能最優、支撐重大專項最多的國產超算集群,算力總規模超過了2300P。在工信部備案的大中型數據中心8個,標準機架突破了5萬架。
目前,青島已開通了國家級互聯網骨干直聯點,正在加快建設青島市算力統籌調度平臺,布局“全市算力一張網”,提升算力云服務能力,促進邊緣算力協同部署,提高算力利用效率,正積極融入和服務山東算網、全國一體化算力網。
“算力是發展大模型的硬性條件。一部分人曾將青島形容為‘互聯網荒漠’,可深入了解就會發現,青島這些年一直在為互聯網時代的后半場做準備。特別是在算力的儲備上,青島擁有優勢。”張文政說道。
本表根據網絡資料整理
思考:大模型并不萬能
大模型的發展充滿了想象力,也讓眾多創業公司紛紛涉足其中,希望通過技術創新實現彎道超車。
“對待大模型必須冷靜?!鼻鄭u市人工智能產業協會秘書長姜代楠嚴肅地說道。
大模型的訓練是一個資金成本和時間成本投入皆高的過程,隨著時間和技術的發展,大模型需要持續的維護、更新和優化,這涉及大量的計算資源和人力資源投入。
“大家都在搶占大模型的賽道,包括一些資本也在入局。但大模型研發門檻是比較高的,將大模型打磨成熟需要的時間也比較長?!苯硎?,青島市算力“一張網”已經建成,產業優勢也十分明顯。在大模型應用方面,結合青島實際,產業也應在海洋大模型體系和細分行業領域的垂直大模型體系更多發力。
在人才方面,城市則需要加大人工智能緊缺急需人才的招引力度,促進高端人才向人工智能產業聚集,如引導高校和頭部企業共建人工智能實訓基地;大力培養卓越工程師、高技能人才等實踐型人才。
“協會愿作為和諧重構的連接器,把AI產業和傳統產業進行結合,賦能青島傳統產業突飛猛進的發展?!苯€透露,青島市正在醞釀對人工智能大模型和算力出臺新的獎勵政策包,近期就將公布。
“大模型能做許多事情,但它不是萬能的?!痹趯O仁誠看來,大模型可以賦能于多種產業,但本質上依舊是一種“生成式”算法,不以“精準”著稱,更多是提供一種指導思路?!按竽P碗m然是人工智能的一部分,但它卻是理性中的‘感性派’。我們不能寄希望大模型對未來趨勢做出精準研判,提出意見、輔助決策,才是它的價值?!?/p>
張文政也有相似的觀點,“不上頭”是他的核心觀點?!按竽P筒皇钦f做就做的,宏觀上看,如今的大模型基本還是以大企業為主導。這不是一個無腦跟風的業態,它的投入成本很高,中小企業與其做開發者,倒不如去享受大模型提供的服務,不能因為是藍?;蛘哂袩岫?,就頭腦發熱?!?/p>
在眾多從業者的眼中,大模型的發展趨勢與電商平臺類似。初期百家爭鳴,但隨后便會進入洗牌期,數據為底,流量為王,贏家通吃。
這會是一個充滿想象力又角色分明的新業態。誰搭建底層邏輯,誰開辟垂直賽道,誰是開發者,誰是使用者,各有各的職能,各自扮演各自的角色。
大模型,像一個擁有魔法般力量的智慧伙伴,助力青島向著“人工智能+”巔峰邁進。
青島財經日報/首頁新聞記者 郭清鑒 尹為鑒
責任編輯:李賽男
請輸入驗證碼