1 引言
ChatGPT 是由 OpenAI 研發(fā)的一種語(yǔ)言 AI 模型,使用上億參數(shù)的大模型和海量語(yǔ) 料庫(kù)來(lái)生成語(yǔ)句,目前可以實(shí)現(xiàn)寫(xiě)詩(shī)、撰文、編碼的功能。ChatGPT 廣受用戶歡迎, 短短五天注冊(cè)用戶數(shù)量便超過(guò) 100 萬(wàn),60 日月活破億。產(chǎn)業(yè)界如微軟、谷歌、百度 也對(duì)于 openAI 及其競(jìng)品加大投入。
2 ChatGPT 引發(fā)人工智能投資熱潮
2.1 ChatGPT 是什么?
ChatGPT 是由 OpenAI 研發(fā)的一種語(yǔ)言 AI 模型,使用海量語(yǔ)料庫(kù)來(lái)生成與人類相 似的反應(yīng)。ChatGPT 是基于 GPT(generativef pretrained’ transformer)架構(gòu)搭建的, 主要用深度學(xué)習(xí)來(lái)生成連貫且具有意義的文字。這個(gè)模型使用了來(lái)自于網(wǎng)站、書(shū)本和社 交媒體的海量文字?jǐn)?shù)據(jù),因此也為 ChatGPT 在保證準(zhǔn)確性和細(xì)節(jié)的同時(shí),提供了廣泛 的對(duì)話反饋。對(duì)話反饋是 ChatGPT 的核心功能之一,也使它成為了實(shí)現(xiàn)聊天機(jī)器人或 其他對(duì)話型 AI 的理想技術(shù)。除對(duì)話功能外,ChatGPT 也具有實(shí)現(xiàn)各類語(yǔ)言相關(guān)任務(wù)的能力,包括文章精煉、翻 譯以及情緒分析等。以上各類語(yǔ)言能力在大規(guī)模的訓(xùn)練數(shù)據(jù)和升讀學(xué)習(xí)架構(gòu)下,使 ChatGPT 成為目前應(yīng)用最為先進(jìn)的語(yǔ)言模型之一。總體上,ChatGPT 標(biāo)志著自然語(yǔ)言處理(NLP)和對(duì)話 AI 領(lǐng)域的一大步,其高質(zhì) 量文字產(chǎn)出能力在商業(yè)、研究和開(kāi)發(fā)活動(dòng)中提高用戶體驗(yàn)的方向上非常有應(yīng)用價(jià)值的。
圖片
截至目前,GPT 已經(jīng)經(jīng)歷了如下演化:1. GPT-1: 第一代 GPT 語(yǔ)言模型,發(fā)布于 2018 年。它有 1.17 億個(gè)參數(shù),使用網(wǎng)頁(yè) 的文字?jǐn)?shù)據(jù)進(jìn)行訓(xùn)練。2. GPT-2: 發(fā)布于 2019 年,具有 15 億個(gè)參數(shù),使用的網(wǎng)頁(yè)文字?jǐn)?shù)據(jù)量也遠(yuǎn)大于前 一代。它已經(jīng)可以生成高質(zhì)量的文字,甚至完成翻譯、精煉文字等簡(jiǎn)單任務(wù)。3. GPT-3: 發(fā)布于 2020 年,具有 1750 億個(gè)參數(shù),使用網(wǎng)頁(yè)以及其他來(lái)源的文字進(jìn) 行訓(xùn)練。它已經(jīng)可以進(jìn)行擔(dān)任各類任務(wù),被認(rèn)為是語(yǔ)言模型領(lǐng)域的顯著突破。
2.2 ChatGPT 技術(shù)和傳統(tǒng)的 AI 有什么區(qū)別?
相比傳統(tǒng) AI 算法,GPT 模型的區(qū)別在于通過(guò)海量參數(shù),進(jìn)一步提升了模型的精確 度。初代的 GPT 模型參數(shù)是 1.17 億,而 GPT2 的模型有 15 億個(gè)參數(shù),參數(shù)增加了 10 倍之多。第三代的 GPT3 模型,參數(shù)達(dá)到了 1750 億,是 GPT2 參數(shù)的 100 倍。正是由 于參數(shù)的指數(shù)級(jí)提升,使得模型的使用效果大幅提升。而此類參數(shù)上億的模型,通常稱 之為“大模型”。GPT 模型基于 Transformer 架構(gòu),這是一種由谷歌的 Vaswani 等人于 2017 年引入 的神經(jīng)網(wǎng)絡(luò)類型。Transformer 架構(gòu)特別擅長(zhǎng)對(duì)序列數(shù)據(jù)中的長(zhǎng)距離依賴進(jìn)行建模,這使 其非常適合自然語(yǔ)言處理任務(wù)。為了訓(xùn)練 GPT 模型,OpenAI 使用了來(lái)自互聯(lián)網(wǎng)的大量文本數(shù)據(jù),包括書(shū)籍、文章 和網(wǎng)站。該模型使用一種稱為無(wú)監(jiān)督學(xué)習(xí)的技術(shù)進(jìn)行訓(xùn)練,這意味著它學(xué)會(huì)了在沒(méi)有人 類監(jiān)督的情況下預(yù)測(cè)文本序列中的下一個(gè)單詞。GPT 模型能夠生成連貫和語(yǔ)法正確的文本,已被用于廣泛的自然語(yǔ)言處理任務(wù),包 括語(yǔ)言翻譯、文本補(bǔ)全和文本生成。
Transformer 模型是一種用于自然語(yǔ)言處理的神經(jīng)網(wǎng)絡(luò)模型。與傳統(tǒng)的循環(huán)神經(jīng)網(wǎng) 絡(luò)(RNN)不同,Transformer 模型使用自注意力機(jī)制(self-attention)來(lái)處理輸入序列 中不同位置之間的依賴關(guān)系。Transformer 模型由編碼器和解碼器兩部分組成。編碼器將輸入序列中的每個(gè)單詞 表示為一個(gè)向量,并通過(guò)多層自注意力和前饋神經(jīng)網(wǎng)絡(luò)來(lái)對(duì)輸入序列進(jìn)行編碼。解碼器 則使用相同的自注意力和前饋神經(jīng)網(wǎng)絡(luò)來(lái)生成輸出序列。在自注意力機(jī)制中,模型根據(jù)輸入序列中的所有單詞計(jì)算出每個(gè)單詞與其他單詞的 相關(guān)性,然后使用這些相關(guān)性加權(quán)求和得到每個(gè)單詞的表示向量。這種方法使得模型能 夠處理長(zhǎng)序列和跨越序列中的依賴關(guān)系,從而提高了模型的性能。Transformer 模型已經(jīng)在自然語(yǔ)言處理領(lǐng)域取得了很好的效果,包括機(jī)器翻譯、文 本摘要和問(wèn)答系統(tǒng)等任務(wù)。它是目前最先進(jìn)的語(yǔ)言模型之一,也是開(kāi)發(fā)其他自然語(yǔ)言處 理模型的基礎(chǔ)。
2.3 ChatGPT 將給行業(yè)帶來(lái)哪些機(jī)會(huì)?
相比其他此前的人工智能技術(shù)與進(jìn)展,ChatGPT 之所以引發(fā)關(guān)注,主要總結(jié)為以下 幾點(diǎn):1) 從使用效果上,交流通暢,同時(shí)能夠?qū)崿F(xiàn)寫(xiě)詩(shī)、撰文、編碼的功能。2 月 1 日, 以色列總統(tǒng)艾薩克·赫爾佐格(Isaac Herzog)發(fā)表了部分由人工智能(AI)撰寫(xiě)的 演講;2) 受用戶歡迎。短短 5 天,注冊(cè)用戶數(shù)就超過(guò) 100 萬(wàn)。60 天月活破億。3) 商業(yè)模式產(chǎn)生變化。2023 年 2 月 2 日,美國(guó)人工智能(AI)公司 OpenAI 發(fā)布 ChatGPT 試點(diǎn)訂閱計(jì)劃。4) 產(chǎn)業(yè)界也表現(xiàn)出對(duì) Chatgpt 的關(guān)注。表現(xiàn)為:1)1 月 23 日,微軟宣布向 ChatGPT 開(kāi)發(fā)者 OpenAI 追加投資數(shù)十億美元;2)谷歌 3 億美元投資 Chatgpt 競(jìng)品。3)百度將于 3 月發(fā)布類似 Chatgpt 的 AI 服務(wù)。由此帶來(lái)相關(guān)產(chǎn)業(yè)鏈的大變革:
1) 語(yǔ)音識(shí)別與自然語(yǔ)言處理行業(yè)快速發(fā)展:人工智能,也即解決像人一樣看、聽(tīng)、思考的問(wèn)題。因此,按照此維度來(lái)劃分,劃 分為計(jì)算機(jī)視覺(jué)、語(yǔ)音識(shí)別與自然語(yǔ)言處理及數(shù)據(jù)科學(xué)。早先,2020 年數(shù)據(jù)顯示,計(jì)算機(jī)視覺(jué)占比約 56.6%;語(yǔ)音識(shí)別與自然語(yǔ)言處理占比 約 35.6%。也即,在機(jī)器視覺(jué)領(lǐng)域的應(yīng)用,相比自然語(yǔ)言處理,更為成熟,市場(chǎng)規(guī)模更 大。但隨著 ChatGPT 帶來(lái)的投資熱潮,與應(yīng)用領(lǐng)域的不斷豐富,音頻與自然語(yǔ)言處理 的整體行業(yè)規(guī)模,有望迅速增長(zhǎng)。
圖片
2) 激活產(chǎn)業(yè)鏈:整個(gè)人工智能的產(chǎn)業(yè)鏈包括算力、數(shù)據(jù)、算法乃至下游應(yīng)用。算力與網(wǎng)絡(luò):英偉達(dá)的研究表示,GPT-3 模型需要使用 512 顆 V100 顯卡訓(xùn)練 7 個(gè) 月時(shí)間,或者使用 1024 顆 A100 芯片訓(xùn)練長(zhǎng)達(dá)一個(gè)月的時(shí)間。隨著各大科技廠商投入對(duì) 大模型的研發(fā),勢(shì)必增加芯片、服務(wù)器等算力需求。同時(shí),龐大的 AI 算力集群,又需要 高帶寬支撐數(shù)據(jù)傳輸。數(shù)據(jù):數(shù)據(jù)采集、數(shù)據(jù)標(biāo)注和數(shù)據(jù)質(zhì)檢是較為重要的三個(gè)環(huán)節(jié)。從自然數(shù)據(jù)源簡(jiǎn)單 收集取得的原料數(shù)據(jù)并不能直接用于有效監(jiān)督的深度學(xué)習(xí)算法訓(xùn)練,經(jīng)過(guò)專業(yè)化采集、 加工形成的訓(xùn)練數(shù)據(jù)集才能供深度學(xué)習(xí)算法等訓(xùn)練使用,由此帶來(lái)數(shù)據(jù)服務(wù)需求。算法:相比傳統(tǒng) AI 模型,大模型的優(yōu)勢(shì)體現(xiàn)在:1)解決 AI 過(guò)于碎片化和多樣化 的問(wèn)題;2) 具備自監(jiān)督學(xué)習(xí)功能,降低訓(xùn)練研發(fā)成本;3)擺脫結(jié)構(gòu)變革桎梏,打開(kāi) 模型精度上限。對(duì)于大模型算法的研發(fā)、優(yōu)化,亦是投入的重點(diǎn)。下游應(yīng)用:產(chǎn)業(yè)界一直以來(lái)都在尋求人工智能的應(yīng)用領(lǐng)域、商業(yè)模式突破。隨著大 模型使用、人工智能算法精度提升,下游應(yīng)用的擴(kuò)展可期。
3 數(shù)據(jù)要素資源基礎(chǔ),滿足大模型訓(xùn)練需求
3.1 政策引導(dǎo)數(shù)據(jù)要素確權(quán)使用,掃清人工智能發(fā)展障礙
數(shù)據(jù)已成為五大核心生產(chǎn)要素之一。2020 年 4 月中共中央國(guó)務(wù)院《關(guān)于構(gòu)建更加完善的要素市場(chǎng)化配置體制機(jī)制的意 見(jiàn)》中發(fā)布。這是數(shù)據(jù)作為新型生產(chǎn)要素首次在中央頂層文件中提出。而后,2022 年 4 月國(guó)務(wù)院《關(guān)于加快建設(shè)全國(guó)統(tǒng)一大市場(chǎng)的意見(jiàn)》中,進(jìn)一步提到 加快培育數(shù)據(jù)要素市場(chǎng),建立數(shù)據(jù)資源產(chǎn)權(quán)相關(guān)基礎(chǔ)制度。2022 年 12 月 9 日,財(cái)政部發(fā)布關(guān)于征求《企業(yè)數(shù)據(jù)資源相關(guān)會(huì)計(jì)處理暫行規(guī)定 (征求意見(jiàn)稿)》意見(jiàn)的函,具體提出了企業(yè)數(shù)據(jù)資源相關(guān)會(huì)計(jì)、處理的方式方法,進(jìn)一 步掃清了數(shù)據(jù)要素市場(chǎng)建立、數(shù)據(jù)資源交易的障礙。當(dāng)前,2022 年 12 月發(fā)布《關(guān)于構(gòu)建數(shù)據(jù)基礎(chǔ)制度更好發(fā)揮數(shù)據(jù)要素作用的意見(jiàn)》, 是數(shù)據(jù)要素體系建設(shè)中,頂層關(guān)鍵文件,掃除了未來(lái)人工智能發(fā)展中需要使用數(shù)據(jù)的障 礙:1)建立保障權(quán)益,合規(guī)使用的數(shù)據(jù)產(chǎn)權(quán)制度;2)建立合規(guī)高效的場(chǎng)內(nèi)外結(jié)合的數(shù) 據(jù)要素流通和交易制度。3)建立體現(xiàn)效率促進(jìn)公平的數(shù)據(jù)要素收益分配制度。4)建立 安全可控彈性包容的數(shù)據(jù)要素治理制度。
數(shù)字經(jīng)濟(jì)快速發(fā)展,數(shù)據(jù)要素成為重要戰(zhàn)略資源?!丁笆奈濉睌?shù)字經(jīng)濟(jì)發(fā)展規(guī)劃》 中指出,數(shù)字經(jīng)濟(jì)是繼農(nóng)業(yè)經(jīng)濟(jì)、工業(yè)經(jīng)濟(jì)之后的主要經(jīng)濟(jì)形態(tài)?!兑?guī)劃》設(shè)定了到 2025 年實(shí)現(xiàn)數(shù)字經(jīng)濟(jì)核心產(chǎn)業(yè)增加值占 GDP 比重達(dá)到 10%的目標(biāo),涵蓋數(shù)據(jù)要素市場(chǎng)、產(chǎn) 業(yè)數(shù)字化、數(shù)字產(chǎn)業(yè)化、數(shù)字化公共服務(wù)、數(shù)字經(jīng)濟(jì)治理體系五個(gè)方面。從 2015 年至 今,數(shù)字經(jīng)濟(jì)平均增速持續(xù)高于 GDP 增速,2021 年數(shù)字經(jīng)濟(jì)占 GDP 比重已經(jīng)由 2015 年的 27%提升至 40%。
圖片
3.2 大數(shù)據(jù)管理能力需求提升
聯(lián)網(wǎng)設(shè)備高增之下,流量增長(zhǎng)不可避免。根據(jù)思科的《年度互聯(lián)網(wǎng)報(bào)告》,到 2023 年,地球上的連網(wǎng)設(shè)備數(shù)量將是全球人口的大約三倍,從 2017 年的人均 2.4 臺(tái)提升至 3.6 臺(tái)。由于 IP 地址即網(wǎng)絡(luò)地址+主機(jī)地址,網(wǎng)絡(luò)站點(diǎn)所連接的 IP 數(shù)量也處于爆發(fā)的階 段。根據(jù) IDC 的《中國(guó)物聯(lián)網(wǎng)連接規(guī)模預(yù)測(cè),2020-2025》,僅我國(guó)物聯(lián)網(wǎng) IP 連接量已 在 2020 年達(dá) 45.3 億,有望在 2025 年達(dá)到 102.7 億,CAGR 為 17.8%。由于 IP 地址 聯(lián)網(wǎng)后即產(chǎn)生數(shù)據(jù)流量, IP 地址的數(shù)量增長(zhǎng)即代表全網(wǎng)數(shù)據(jù)也將繼續(xù)大增,對(duì)于現(xiàn)有 的網(wǎng)絡(luò)企業(yè)的承載能力提出了考驗(yàn)。根據(jù)思科的《年度互聯(lián)網(wǎng)報(bào)告》,2022 年全球網(wǎng)絡(luò) 數(shù)據(jù)流量將達(dá) 799EB(1EB=十億 GB),同比增長(zhǎng) 21%。我們認(rèn)為,數(shù)據(jù)流量的增長(zhǎng), 有望直接帶動(dòng)大數(shù)據(jù)產(chǎn)業(yè)的發(fā)展,而其中穩(wěn)定優(yōu)質(zhì)響應(yīng)快的數(shù)據(jù)庫(kù)性價(jià)比更高。
全球大數(shù)據(jù)市場(chǎng)存量巨大,軟件市場(chǎng)占比較高且增速快。根據(jù) Wikibon 及沙利文研 究數(shù)據(jù),全球大數(shù)據(jù)市場(chǎng)規(guī)模有望在 2022 年達(dá) 718 億美元,同比增速 11%;而其中全 球大數(shù)據(jù)軟件偉 286 億美元,同比增速 18%,約占大數(shù)據(jù)市場(chǎng)規(guī)模的 40%??梢哉J(rèn)為, 軟件市場(chǎng)在大數(shù)據(jù)市場(chǎng)中,占據(jù)較大地位,而由于其增速高于大數(shù)據(jù)市場(chǎng)的整體增速, 其占比還將進(jìn)一步提升。
圖片
3.3 數(shù)據(jù)標(biāo)注,是 AI 模型的基礎(chǔ)
人工智能基礎(chǔ)數(shù)據(jù)服務(wù)助力 AI 訓(xùn)練與調(diào)優(yōu),數(shù)據(jù)采集、數(shù)據(jù)標(biāo)注和數(shù)據(jù)質(zhì)檢是較 為重要的三個(gè)環(huán)節(jié)。從自然數(shù)據(jù)源簡(jiǎn)單收集取得的原料數(shù)據(jù)并不能直接用于有效監(jiān)督的 深度學(xué)習(xí)算法訓(xùn)練,經(jīng)過(guò)專業(yè)化采集、加工形成的訓(xùn)練數(shù)據(jù)集才能供深度學(xué)習(xí)算法等訓(xùn) 練使用,從某種程度上講,數(shù)據(jù)決定了 AI 的落地程度,因此,基礎(chǔ)數(shù)據(jù)服務(wù)應(yīng)運(yùn)而生。具體來(lái)看,基礎(chǔ)數(shù)據(jù)的服務(wù)流程圍繞著客戶的展開(kāi),為 AI 模型訓(xùn)練提供可靠、可用的數(shù) 據(jù),其包含五個(gè)環(huán)節(jié),分別是 1)數(shù)據(jù)庫(kù)設(shè)計(jì):訓(xùn)練數(shù)據(jù)集結(jié)構(gòu)設(shè)計(jì);2)數(shù)據(jù)采集:獲 取原料數(shù)據(jù);3)數(shù)據(jù)清洗:清洗殘缺、重復(fù)或者錯(cuò)誤的數(shù)據(jù);4)數(shù)據(jù)標(biāo)注:幫助機(jī)器 認(rèn)識(shí)數(shù)據(jù)的特征;5)質(zhì)檢:各環(huán)節(jié)質(zhì)量檢測(cè)和控制。
市場(chǎng)標(biāo)注行業(yè)市場(chǎng)規(guī)模不斷擴(kuò)大,圖像類和語(yǔ)音類需求占比超八成。從市場(chǎng)規(guī)模來(lái) 看,根據(jù)觀研天下統(tǒng)計(jì),2021 年我國(guó)數(shù)據(jù)標(biāo)注行業(yè)市場(chǎng)規(guī)模為 43 億元,2017 至 2029 年的 CAGR 為 23%;根據(jù) IDC《2021 年中國(guó)人工智能基礎(chǔ)數(shù)據(jù)服務(wù)市場(chǎng)研究報(bào)告》, 預(yù)計(jì)中國(guó) AI 基礎(chǔ)數(shù)據(jù)服務(wù)市場(chǎng)規(guī)模將在 2025 年突破 120 億元,近五年的 CAGR 達(dá) 47%。從市場(chǎng)收入結(jié)構(gòu)來(lái)看,按數(shù)據(jù)類型劃分,基礎(chǔ)數(shù)據(jù)服務(wù)行業(yè)是市場(chǎng)需求可以分為 圖像類、語(yǔ)音類和自然語(yǔ)言處理類數(shù)據(jù)需求。根據(jù)觀研天下統(tǒng)計(jì),2021 年我國(guó)數(shù)據(jù)標(biāo)注 行業(yè)下游以圖像類和語(yǔ)音類需求為主,二者合計(jì)占比達(dá) 86%,其中,圖像類業(yè)務(wù)以智能 駕駛與安防為主,語(yǔ)音類以中英大大語(yǔ)種、中國(guó)本土方言以及外國(guó)小語(yǔ)種為主。
3.4 相關(guān)標(biāo)的
1) 星環(huán)科技:平臺(tái)、數(shù)據(jù)庫(kù)集一身的數(shù)據(jù)要素稀缺標(biāo)的
專注于分布式數(shù)據(jù)庫(kù),技術(shù)水平全球領(lǐng)先。星環(huán)科技 2013 年成立于上海,是國(guó)內(nèi) 大數(shù)據(jù)管理軟件領(lǐng)導(dǎo)者,已累計(jì)有超過(guò) 1,000 家終端用戶,且產(chǎn)品已落地以下知名機(jī)構(gòu) 或其主要分支機(jī)構(gòu),金融行業(yè)包括中國(guó)銀行、浦發(fā)銀行、浙江農(nóng)村商業(yè)聯(lián)合銀行等,政 府領(lǐng)域包括上海市大數(shù)據(jù)中心等,能源行業(yè)包括中國(guó)石油、南方電網(wǎng)等,交通行業(yè)包括 中國(guó)郵政集團(tuán)、鄭州地鐵等,制造業(yè)包括湖南中煙等。公司在發(fā)展中經(jīng)歷了多個(gè)重要節(jié) 點(diǎn):1)公司 2013 年成立,隨即發(fā)布了大數(shù)據(jù)基礎(chǔ)平臺(tái) TDH2.0 版本,并于次年推出 Inceptor 關(guān)系型分析引擎、Slipstream 實(shí)時(shí)計(jì)算引擎,實(shí)現(xiàn)數(shù)據(jù)湖、實(shí)時(shí)計(jì)算兩大熱點(diǎn) 功能;2)2014 年公司被 Gartner 列入 Hadoop 的主流發(fā)行版列表;3)2017 年起,公 司陸續(xù)發(fā)布新品,包括分析工具 Sophon、云產(chǎn)品 TDC、分布式分析數(shù)據(jù)庫(kù) ArgoDB 和 分布式交易數(shù)據(jù)庫(kù) KunDB。2022 年,公司已被 Gartner 評(píng)為圖數(shù)據(jù)庫(kù)管理的全球代表 廠商。
圖片
股權(quán)結(jié)構(gòu)穩(wěn)定,創(chuàng)始人保持控制權(quán)。發(fā)行人的控股股東、實(shí)際控制人為創(chuàng)始人孫元 浩,主要理由如下:(1)截至本招股說(shuō)明書(shū)簽署日,孫元浩直接持有星環(huán)科技 12.3%的 股份,為公司第一大股東,且在報(bào)告期內(nèi)持續(xù)為發(fā)行人第一大股東。(2)孫元浩與范磊、 呂程、佘暉及贊星投資中心簽署了《一致行動(dòng)協(xié)議》,確認(rèn) 自 2019 年 1 月 1 日起, 范磊、呂程、佘暉及贊星投資中心與孫元浩在發(fā)行人有關(guān)重大事項(xiàng)中保持一致行動(dòng),并 約定上述各方在無(wú)法達(dá)成一致意見(jiàn)時(shí),為提高公司決策效率,在不損害孫元浩合法權(quán)益 及保障公司整體利益的前提下,應(yīng)以孫元浩的意見(jiàn)作為各方的最終共同意見(jiàn)。孫元浩擔(dān) 任執(zhí)行事務(wù)合伙人的贊星投資中心持有公司 8.3%的股份,孫元浩之一致行動(dòng)人范磊、呂 程、佘暉分別持有公司 6.7%、1.7%、1.0%的股份。因此,孫元浩本人及通過(guò)《一致行 動(dòng)協(xié)議》合計(jì)控制公司 30.0%的股份。(3)報(bào)告期內(nèi),孫元浩一直擔(dān)任發(fā)行人(及其前 身星環(huán)有限)的董事長(zhǎng)及總經(jīng)理,在發(fā)行人的董事會(huì)和日常管理決策中均能夠產(chǎn)生重大 影響。( 4)根據(jù)除孫元浩、范磊、呂程、佘暉及贊星投資中心以外的發(fā)行人其他股東的 書(shū)面確認(rèn),各方均認(rèn)可孫元浩于報(bào)告期內(nèi)作為發(fā)行人的實(shí)際控制人。
2) 海天瑞聲:人工智能基礎(chǔ)數(shù)據(jù)服務(wù)提供商,產(chǎn)品矩陣不斷豐富
自 2005 年成立以來(lái),海天瑞聲始終致力于為 AI 產(chǎn)業(yè)鏈上的各類機(jī)構(gòu)提供算法模型 開(kāi)發(fā)訓(xùn)練所需的專業(yè)數(shù)據(jù)集,目前已發(fā)展為人工智能領(lǐng)域具備國(guó)際競(jìng)爭(zhēng)力的國(guó)內(nèi)領(lǐng)軍企 業(yè)。公司研發(fā)生產(chǎn)的訓(xùn)練數(shù)據(jù)覆蓋了智能語(yǔ)音、計(jì)算機(jī)視覺(jué)及自然語(yǔ)言處理三大 AI 核心 領(lǐng)域,實(shí)現(xiàn)了標(biāo)準(zhǔn)化產(chǎn)品、定制化服務(wù)、相關(guān)應(yīng)用服務(wù)的全覆蓋,廣泛應(yīng)用于人機(jī)交互、 智能家居、智能駕駛、智慧金融、智能安防、OCR 識(shí)別等多個(gè)應(yīng)用場(chǎng)景。截至 2022 年 半年報(bào),公司累計(jì)客戶量達(dá) 695 家。
公司產(chǎn)品應(yīng)用領(lǐng)域不斷拓寬,下游客戶豐富。從應(yīng)用場(chǎng)景來(lái)看,公司產(chǎn)品的應(yīng)用場(chǎng) 景覆蓋了個(gè)人助手、語(yǔ)音輸入、智能家居、智能客服、機(jī)器人、語(yǔ)音導(dǎo)航、智能播報(bào)、 語(yǔ)音翻譯、移動(dòng)社交、虛擬人、智能駕駛、智慧金融、智慧交通、智慧城市、機(jī)器翻譯、 智能問(wèn)答、信息提取、情感分析、OCR 識(shí)別等多種應(yīng)用場(chǎng)景。從下游客戶來(lái)看,公司的客戶為 AI 產(chǎn)業(yè)鏈上的各類機(jī)構(gòu),主要系:1)大型科技公司,阿里巴巴、騰訊、百度、 微軟等;2)人工智能企業(yè),科大訊飛、商湯科技、??低暤?;3)科研機(jī)構(gòu),如中國(guó) 科學(xué)院、清華大學(xué)等。目前,公司的產(chǎn)品和服務(wù)已經(jīng)獲得了阿里巴巴、騰訊百度、科大 訊飛、微軟、清華大學(xué)等國(guó)內(nèi)外客戶的認(rèn)可。
圖片
4 ChatGPT 帶來(lái)的變革——大模型算法
4.1 大模型時(shí)代的引言:Double Descent(雙下降)現(xiàn)象
隨著深度神經(jīng)網(wǎng)絡(luò)的興起,人工智能進(jìn)入統(tǒng)計(jì)分類深度模型時(shí)代,這種模型比以往 的模型更加泛化,可以通過(guò)提取不同特征值應(yīng)用于不同場(chǎng)景。但在 2018 年-2019 年, 雙下降現(xiàn)象的發(fā)現(xiàn)打破了原有的人工智能發(fā)展格局。簡(jiǎn)而言之,以往的數(shù)學(xué)理論表明, 隨著參數(shù)增多、模型增大,過(guò)擬合導(dǎo)致模型的誤差會(huì)先下降后上升,這使得找到精度最 高誤差最小的點(diǎn)成為模型調(diào)整的目標(biāo)。而隨著人工智能算法算力的不斷發(fā)展,研究者發(fā) 現(xiàn)如果繼續(xù)不設(shè)上限的增大模型,模型誤差會(huì)在升高后第二次降低,并且誤差下降會(huì)隨 著模型的不斷增大而降低,通俗而言模型越大,準(zhǔn)確率越高。因此人工智能發(fā)展進(jìn)入了 大模型時(shí)代。
相比傳統(tǒng) AI 模型,大模型的優(yōu)勢(shì)體現(xiàn)在:1)解決 AI 過(guò)于碎片化和多樣化的問(wèn)題,極大提高模型的泛用性。應(yīng)對(duì)不同場(chǎng)景 時(shí),AI 模型往往需要進(jìn)行針對(duì)化的開(kāi)發(fā)、調(diào)參、優(yōu)化、迭代,需要耗費(fèi)大量的人力成 本,導(dǎo)致了 AI 手工作坊化。大模型采用“預(yù)訓(xùn)練+下游任務(wù)微調(diào)”的方式,首先從大量標(biāo) 記或者未標(biāo)記的數(shù)據(jù)中捕獲信息,將信息存儲(chǔ)到大量的參數(shù)中,再進(jìn)行微調(diào),極大提高 模型的泛用性。2)具備自監(jiān)督學(xué)習(xí)功能,降低訓(xùn)練研發(fā)成本。我們可以將自監(jiān)督學(xué)習(xí)功能表觀理 解為降低對(duì)數(shù)據(jù)標(biāo)注的依賴,大量無(wú)標(biāo)記數(shù)據(jù)能夠被直接應(yīng)用。這樣一來(lái),一方面降低 人工成本,另一方面,使得小樣本訓(xùn)練成為可能。3)擺脫結(jié)構(gòu)變革桎梏,打開(kāi)模型精度上限。過(guò)去想要提升模型精度,主要依賴網(wǎng) 絡(luò)在結(jié)構(gòu)上的變革。隨著神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)設(shè)計(jì)技術(shù)逐漸成熟并開(kāi)始趨同,想要通過(guò)優(yōu)化神 經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)從而打破精度局限變得困難。而研究證明,更大的數(shù)據(jù)規(guī)模確實(shí)提高了模型 的精度上限。
4.2 首要關(guān)鍵技術(shù):Transformer 模型 GPT 模型利用
Transformer 模型作為特征提取器,是第一個(gè)引入 Transformer 的預(yù) 訓(xùn)練模型。傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)模型例如 RNN(循環(huán)神經(jīng)網(wǎng)絡(luò))在實(shí)際訓(xùn)練過(guò)程中由于輸入 向量大小不一、且向量間存在相互影響關(guān)系導(dǎo)致模型訓(xùn)練結(jié)果效果較差。Transformer 模 型有三大技術(shù)突破解決了這個(gè)問(wèn)題。首先 Transformer 模型的 Self-Attention(自注意力)機(jī)制使人工智能算法注意到輸 入向量中不同部分之間的相關(guān)性,從而大大提升了精準(zhǔn)性。其次該模型采用屬于無(wú)監(jiān)督 學(xué)習(xí)的自監(jiān)督學(xué)習(xí),無(wú)需標(biāo)注數(shù)據(jù),模型直接從無(wú)標(biāo)簽數(shù)據(jù)中自行學(xué)習(xí)一個(gè)特征提取器, 大大提高了效率。最后,在做具體任務(wù)時(shí),微調(diào)旨在利用其標(biāo)注樣本對(duì)預(yù)訓(xùn)練網(wǎng)絡(luò)的參 數(shù)進(jìn)行調(diào)整。也可以針對(duì)具體任務(wù)設(shè)計(jì)一個(gè)新網(wǎng)絡(luò),把預(yù)訓(xùn)練的結(jié)果作為其輸入,大大 增加了其通用泛化能力。Transformer 模型的這些優(yōu)點(diǎn)快速替代了傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)。
圖片
4.3 GPT 快速迭代,從 GPT1.0 迅速步入 3.5 時(shí)代
GPT:大型無(wú)監(jiān)督語(yǔ)言模型,能夠生產(chǎn)連貫的文本段落。GPT-1 采用無(wú)監(jiān)督預(yù)訓(xùn)練 和有監(jiān)督微調(diào),證明了 transformer 對(duì)學(xué)習(xí)詞向量的強(qiáng)大能力,在 GPT-1 得到的詞向量 基礎(chǔ)上進(jìn)行下游任務(wù)的學(xué)習(xí),能夠讓下游任務(wù)取得更好的泛化能力。與此同時(shí),不足也 較為明顯,該模型在未經(jīng)微調(diào)的任務(wù)上雖然有一定效果,但是其泛化能力遠(yuǎn)遠(yuǎn)低于經(jīng)過(guò) 微調(diào)的有監(jiān)督任務(wù),說(shuō)明了 GPT-1 只是一個(gè)簡(jiǎn)單的領(lǐng)域?qū)<遥峭ㄓ玫恼Z(yǔ)言學(xué)家。
GPT-2 為了解決這一問(wèn)題采用了多任務(wù)模式,其目標(biāo)旨在訓(xùn)練一個(gè)泛化能力更強(qiáng)的 詞向量模型,它并沒(méi)有對(duì) GPT-1 的網(wǎng)絡(luò)進(jìn)行過(guò)多的結(jié)構(gòu)的創(chuàng)新與設(shè)計(jì),只是使用了更多 的網(wǎng)絡(luò)參數(shù)和更大的數(shù)據(jù)集,GPT-2 的核心思想是當(dāng)模型的容量非常大且數(shù)據(jù)量足夠豐 富時(shí),僅僅靠訓(xùn)練語(yǔ)言模型的學(xué)習(xí)便可以完成其他有監(jiān)督學(xué)習(xí)的任務(wù)。所以雖然它驗(yàn)證 了通過(guò)海量數(shù)據(jù)和大量參數(shù)訓(xùn)練出來(lái)的詞向量模型能夠遷移到其它類別任務(wù)中而不需要 額外的訓(xùn)練,但其任務(wù)表現(xiàn)并不好,還有大很提升空間。不過(guò)其表明了模型容量和數(shù)據(jù) 量越大,其潛能越大。于是 GPT-3 納入了海量參數(shù):1750 億參數(shù)量還有超大的 45TB 的訓(xùn)練數(shù)據(jù)。在大 量的語(yǔ)言模型數(shù)據(jù)集中,GPT-3 超過(guò)了絕大多數(shù)方法。另外 GPT-3 在很多復(fù)雜的 NLP 任務(wù)中例如閉卷問(wèn)答,模式解析,機(jī)器翻譯等也很準(zhǔn)確。除了這些傳統(tǒng)的 NLP 任務(wù), GPT-3 在一些其他的領(lǐng)域也取得了非常好的效果,例如進(jìn)行數(shù)學(xué)加法,文章生成,編寫(xiě) 代碼等。
4.4 國(guó)內(nèi)外 AI 大模型項(xiàng)目百舸爭(zhēng)流
除了 GPT-3 模型外,各大公司正在孵化的大模型項(xiàng)目數(shù)量也相當(dāng)可觀。MT-NLG:微軟英偉達(dá)強(qiáng)強(qiáng)聯(lián)手,軟硬結(jié)合引領(lǐng)行業(yè)新景。2021 年 10 月 11 日,微 軟和英偉達(dá)推出由 DeepSpeed 和 Megatron 驅(qū)動(dòng)的 Megatron-Turing 自然語(yǔ)言生成 模型(MT-NLG), 具有 5300 億個(gè)參數(shù)。MT-NLG 的參數(shù)數(shù)量是當(dāng)時(shí)該類型最大模型 的 3 倍,并且在廣泛的自然語(yǔ)言任務(wù)中如閱讀理解、常識(shí)推理、自然語(yǔ)言推理、詞義消 歧等方面表現(xiàn)出較強(qiáng)的準(zhǔn)確性?;?105 層 transformer 的 MT-NLG 在多個(gè)方面方面 改進(jìn)了當(dāng)時(shí)最先進(jìn)模型,并為大規(guī)模語(yǔ)言模型在模型規(guī)模和質(zhì)量方面設(shè)置了新標(biāo)準(zhǔn)。硬件方面,模型訓(xùn)練是在基于 NVIDIA DGX SuperPOD 的 Selene 超級(jí)計(jì)算機(jī)上進(jìn) 行的,實(shí)現(xiàn)的系統(tǒng)吞吐量為:420 臺(tái) DGX A100 服務(wù)器上考慮了 5300 億參數(shù)模型(批 量大小為 1920 )的系統(tǒng)端到端吞吐量,迭代時(shí)間為 44 . 4 秒、GPU 113 萬(wàn)億次/秒。
Switch Transformers:Google 推出的首個(gè)萬(wàn)億級(jí)語(yǔ)言模型。相比 1750 億參數(shù)的 GPT-3,谷歌 Switch Transformers 則直接將該數(shù)值拉升至 1.6 萬(wàn)億,且相比于 OpenAI 在 GPT-3 里所使用的 Sparse Attention,需要用到稀疏算子而很難發(fā)揮 GPU、TPU 硬 件性能的問(wèn)題。Switch Transformer 不需要稀疏算子,可以更好的適應(yīng) GPU、TPU 等硬 件。
圖片
文心一言:百度集成 NLP 和 CV,多級(jí)體系覆蓋諸多領(lǐng)域。2022 年 11 月 30 日, 百度集團(tuán)在 WAVE SUMMIT+2022 深度學(xué)習(xí)開(kāi)發(fā)者峰會(huì)帶來(lái)了文心大模型的最新升級(jí), 包括新增 11 個(gè)大模型,大模型總量增至 36 個(gè),構(gòu)建起國(guó)內(nèi)業(yè)界規(guī)模最大的產(chǎn)業(yè)大模型 體系。在模型層,文心大模型涵蓋基礎(chǔ)大模型、任務(wù)大模型、行業(yè)大模型的三級(jí)體系;在工具與平臺(tái)層升級(jí)了大模型開(kāi)發(fā)套件、文心 API 和提供全流程開(kāi)箱即用大模型能力的 EasyDL 和 BML 開(kāi)發(fā)平臺(tái),有效降低應(yīng)用門檻;新增產(chǎn)品與社區(qū)層,包括 AI 創(chuàng)作平臺(tái) “文心一格”、搜索系統(tǒng)“文心百中”和樣谷社區(qū),讓更多人感受到 AI 大模型技術(shù)帶來(lái)的新 體驗(yàn)。截至目前,文心已累計(jì)發(fā)布 11 個(gè)行業(yè)大模型,涵蓋電力、燃?xì)?、金融、航天、?媒、城市、影視、制造、社科等領(lǐng)域,加速推動(dòng)行業(yè)的智能化轉(zhuǎn)型升級(jí)。
除行業(yè)大模型外,百度目前新增了 5 個(gè)基礎(chǔ)大模型和 1 個(gè)任務(wù)大模型,包括:知識(shí) 增強(qiáng)輕量級(jí)大模型、跨模態(tài)理解大模型、跨模態(tài)生成大模型、文檔智能大模型、單序列 蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)大模型和代碼大模型。其中,知識(shí)增強(qiáng)輕量級(jí)大模型 ERNIE 3.0 Tiny 具 備優(yōu)秀的泛化能力,同時(shí)相對(duì)于超大參數(shù)模型,推理速度提升數(shù)十倍到百倍,能夠顯著 降低超大參數(shù)模型落地的成本。百度計(jì)劃在 3 月完成文心一言的內(nèi)部測(cè)試,然后向公眾 正式開(kāi)放使用。
阿里 M6:出色的低碳低能耗屬性。阿里巴巴達(dá)摩院在 2021 年開(kāi)發(fā)出了超大規(guī)模中 文多模態(tài)預(yù)訓(xùn)練模型 M6。目前,其參數(shù)已從萬(wàn)億躍遷至 10 萬(wàn)億,規(guī)模遠(yuǎn)超谷歌、微軟 此前發(fā)布的萬(wàn)億級(jí)模型,成為全球最大的 AI 預(yù)訓(xùn)練模型。同時(shí),M6 做到了業(yè)內(nèi)極致的 低碳高效,使用 512 塊 GPU 在 10 天內(nèi)即訓(xùn)練出具有可用水平的 10 萬(wàn)億模型。相比去 年發(fā)布的大模型 GPT-3,M6 實(shí)現(xiàn)同等參數(shù)規(guī)模,能耗為其 1%。M6 的優(yōu)勢(shì)在于將大模 型所需算力壓縮到極致,通過(guò)一系列技術(shù)突破,達(dá)摩院和阿里云只用了 480 塊 GPU 就 訓(xùn)練出了 M6,相比英偉達(dá)用 3072 塊 GPU 訓(xùn)練萬(wàn)億模型、谷歌用 2048 塊 TPU 訓(xùn)練 1.6 萬(wàn)億模型(1 TPU 約等于 2~3GPU),M6 省了超過(guò)八成算力,還將效率提升了近 11 倍。
圖片
商湯在 AIGC 的不同領(lǐng)域有多年布局,從文字,到圖片,以及視頻和動(dòng)畫(huà)的 AIGC, 團(tuán)隊(duì)都從技術(shù)和產(chǎn)業(yè)長(zhǎng)期投入,團(tuán)隊(duì)更多專注在視頻的 AIGC,并疊加商湯自研的類似 于 GPT 的生成式內(nèi)容進(jìn)行短視頻等創(chuàng)作?;谏虦?SenseCoreAI 大裝置,在視覺(jué)大 模型領(lǐng)域,商湯已訓(xùn)練和構(gòu)建了超過(guò) 300 億量級(jí)模型參數(shù)超大基模型,可以有效支持相 關(guān)應(yīng)用。
4.5 相關(guān)標(biāo)的
1) 商湯科技
以 AI 生產(chǎn)力平臺(tái)為基礎(chǔ),四大板塊齊頭并進(jìn)。公司的 AI 生產(chǎn)力平臺(tái) SenseCore 由] 行業(yè)研究 敬請(qǐng)參閱末頁(yè)重要聲明及評(píng)級(jí)說(shuō)明 31 / 80 證券研究報(bào) 告 模型層、深度學(xué)習(xí)平臺(tái)、計(jì)算基礎(chǔ)設(shè)施三個(gè)部分架構(gòu)而成。1)模型層:已開(kāi)發(fā)超過(guò) 4.9 萬(wàn)個(gè)商用人工智能模型;算法開(kāi)源計(jì)劃 OpenMMLab 在 GitHub 上超 60000 顆星;OpenDILab 開(kāi)源平臺(tái),已發(fā)布超過(guò) 60 個(gè)通用決策人工智能算法系列。2)深度學(xué)習(xí)平 臺(tái):高效利用 GPU 集群算力,訓(xùn)練單個(gè)大模型時(shí)可以在一千塊 GPU 上取得超過(guò) 90% 的加速效率。3)計(jì)算基礎(chǔ)設(shè)施:公司正在建立人工智能計(jì)算中心,預(yù)計(jì)能產(chǎn)生每秒 3.74 百億億次浮點(diǎn)運(yùn)算算力,算力超過(guò) 2.5 exaFLOPS,相較于 2021 年底擴(kuò)大 114%;公司 研發(fā)的人工智能芯片及邊緣設(shè)備支持視覺(jué)領(lǐng)域大模型 100 億參數(shù);公司研發(fā)的傳感器及 ISP 芯片 1 天內(nèi)可完成的完整訓(xùn)練 1000 億參數(shù)模型。在 SenseCore 底座基礎(chǔ)上,公司 開(kāi)發(fā)了智慧企業(yè)、智慧城市、智慧生活、智慧汽車四大板塊:
智慧商業(yè):智慧商業(yè)是公司的主要業(yè)務(wù)之一,營(yíng)收占比超過(guò) 40%。公司依托 SenseCore 基座打造了 SenseFoundry Enterpri,形成商業(yè)空間管理、住宅物業(yè)管理、 工業(yè)引擎等具體解決方案。截至 2021 年,該業(yè)務(wù)客戶數(shù)量擴(kuò)大至 922 家。智慧城市:2021 年公司智慧城市收入占比達(dá) 46%。公司研發(fā)的 SenseFoundry 主 要面向出行和交通管理、城市服務(wù)和環(huán)境保護(hù)等領(lǐng)域提供解決方案。目前公司在中國(guó)智 慧城市計(jì)算機(jī)視覺(jué)軟件市場(chǎng)份額第一,中國(guó)智慧應(yīng)急人工智能與大數(shù)據(jù)市場(chǎng)份額第一。截至 2022 年上半年,累計(jì)有 155 個(gè)城市部署城市方舟,包括 16 個(gè)超千萬(wàn)人口大型城市 及 4 個(gè)海外城市。智慧生活:公司是智能手機(jī)產(chǎn)業(yè)的頭部 AI 軟件供應(yīng)商,截至 2022 年 6 月 30 日, 已累計(jì)有 180 多個(gè)手機(jī)型號(hào)的超過(guò) 17 億臺(tái)手機(jī)預(yù)裝了商湯的各類 AI 算法。公司的 SenseMARS 內(nèi)置了 AI 生成內(nèi)容、三維世界重建、數(shù)字人及虛擬形象等模塊,目前已覆 蓋的空間面積突破了 1000 萬(wàn)平米,覆蓋了 120 多個(gè)大型游樂(lè)園區(qū)、商場(chǎng)等。智慧汽車:商湯科技推出的 SenseAuto,以 SenseCore 為基石,以 SenseAuto Empower 為底座,在智能駕駛、智能座艙、車路協(xié)同、L4 級(jí)無(wú)人駕駛、無(wú)人駕駛小巴 推進(jìn)全線產(chǎn)品化商用。公司的智能駕駛和智能座艙產(chǎn)品累計(jì)前裝定點(diǎn)數(shù)量達(dá) 2300 萬(wàn)臺(tái), 覆蓋未來(lái)五年內(nèi)量產(chǎn)的 60 多款車型。
2) 科大訊飛
AI 應(yīng)用快速發(fā)展,構(gòu)建人工智能產(chǎn)業(yè)生態(tài)。公司自創(chuàng)業(yè)以來(lái)持續(xù)聚焦智能語(yǔ)音、自 然語(yǔ)言理解、機(jī)器學(xué)習(xí)推理及自主學(xué)習(xí)等人工智能核心技術(shù)研究并始終保持國(guó)際前沿技 術(shù)水平。目前公司已經(jīng)從語(yǔ)音 AI 逐漸拓展至到教育、醫(yī)療、智慧城市、消費(fèi)、智能汽 車等多領(lǐng)域布局。同時(shí),隨著 ChatGPT 掀起熱潮,公司的類 ChatGPT 技術(shù)也將于 5 月落地,率先用于 AI 學(xué)習(xí)機(jī)。智慧教育業(yè)務(wù):智慧教育業(yè)務(wù)是公司的第一大業(yè)務(wù),在收入中占比 30%左右。公司 構(gòu)建了面向 G/B/C 三類客戶的業(yè)務(wù)體系:G 端業(yè)務(wù)主要以市縣區(qū)等區(qū)域建設(shè)為主體;B 端業(yè)務(wù)主要以學(xué)校建設(shè)為主體;C 端業(yè)務(wù)主要以家長(zhǎng)用戶群自主購(gòu)買為主。目前訊飛智 慧教育產(chǎn)品已在全國(guó) 32 個(gè)省級(jí)行政單位以及日本、新加坡等海外市場(chǎng)應(yīng)用。
圖片
3) 云從科技
持續(xù)賦能 AI 領(lǐng)域,打造高效人機(jī)協(xié)同操作系統(tǒng)和行業(yè)解決方案。公司是首個(gè)同時(shí)承 建三大國(guó)家平臺(tái),并參與國(guó)家及行業(yè)標(biāo)準(zhǔn)制定的人工智能領(lǐng)軍企業(yè)。公司以計(jì)算機(jī)視覺(jué)、 語(yǔ)音識(shí)別為代表的人工智能單點(diǎn)技術(shù)為突破,通過(guò)不斷研發(fā)并優(yōu)化人機(jī)協(xié)同操作系統(tǒng)和 適配性強(qiáng)的 AIoT 設(shè)備,推動(dòng)人工智能在特定場(chǎng)景的應(yīng)用。公司具有人工智能芯片平臺(tái)、 深度學(xué)習(xí)框架、AIoT 操作系統(tǒng)、算法算力平臺(tái)、知識(shí)中臺(tái)、自動(dòng)駕駛平臺(tái)、機(jī)器人開(kāi)發(fā) 平臺(tái)等豐富的產(chǎn)品:智慧金融業(yè)務(wù):公司智慧金融解決方案將相關(guān)算法能力落地為技術(shù)平臺(tái),主要面向 智慧支付、智慧營(yíng)運(yùn)、智慧觸點(diǎn)、智慧風(fēng)控四大領(lǐng)域,形成了 5 大類金融業(yè)智能化轉(zhuǎn)型 解決方案簇,以及 53 種解決方案。目前公司在智慧金融領(lǐng)域的客戶已涵蓋 6 大行、12 家股份制銀行以及城農(nóng)商行,服務(wù)了超過(guò) 400 家金融機(jī)構(gòu)和 10 余萬(wàn)個(gè)銀行網(wǎng)點(diǎn)。
4) 依圖科技
以人工智能芯片技術(shù)和算法技術(shù)為核心,持續(xù)深耕智能公共服務(wù)及智能商業(yè)領(lǐng)域。公司以人工智能算法和芯片等核心技術(shù)為基礎(chǔ),在城市管理、醫(yī)療健康、安全生產(chǎn)、交 通出行和互聯(lián)網(wǎng)服務(wù)等場(chǎng)景實(shí)現(xiàn)規(guī)?;虡I(yè)落地和與產(chǎn)業(yè)的深度融合。目前公司已為國(guó) 內(nèi) 30 余省、自治區(qū)、直轄市及境外 10 多個(gè)國(guó)家和地區(qū)的 800 余家政府及企業(yè)終端客戶 提供產(chǎn)品及解決方案:
智能公共服務(wù),公司智能公共服務(wù)主要包括智能城市和智能醫(yī)療:1)智能城市,公司主要著力于三方面:高性能算法賦能城市復(fù)雜場(chǎng)景。公司在計(jì)算 機(jī)視覺(jué)的多個(gè)細(xì)分領(lǐng)域、聲紋識(shí)別、中文語(yǔ)音識(shí)別及自然語(yǔ)言理解技術(shù)均已達(dá)到世界領(lǐng) 先水平,可對(duì)城市實(shí)體在復(fù)雜多樣場(chǎng)景下產(chǎn)生的非結(jié)構(gòu)化數(shù)據(jù)進(jìn)行解析、識(shí)別和關(guān)聯(lián), 構(gòu)建出完整的城市實(shí)體關(guān)聯(lián)關(guān)系。高效能算力硬件產(chǎn)品降低城市智能化門檻。公司的原 石系列智能服務(wù)器和前沿系列邊緣計(jì)算設(shè)備,在顯著提高城市視頻智能解析吞吐效率的 同時(shí),大幅降低了算力功耗,從而降低了投資和運(yùn)營(yíng)成本?!袄f”方案降低建設(shè)成本。公司將大量已建設(shè)的非智能攝像機(jī)采集的原始數(shù)據(jù)在云端進(jìn)行解析,與智能攝像機(jī)的解 析結(jié)果在云端實(shí)現(xiàn)匯聚、融合分析,大大降低智能化建設(shè)的投資成本。2)智能醫(yī)療方面,公司是業(yè)內(nèi)少數(shù)具有以多模態(tài)人工智能技術(shù)解析多源異構(gòu)醫(yī)療大 數(shù)據(jù)能力,并具有自研醫(yī)療知識(shí)圖譜的企業(yè)之一。公司在上海兒童醫(yī)學(xué)中心建設(shè)的智慧 兒童醫(yī)院解決方案能夠?yàn)榛颊邌未尉驮\至少節(jié)約 90 分鐘,落地一年來(lái),該解決方案僅智 能導(dǎo)診應(yīng)用就已累計(jì)為超過(guò) 27 萬(wàn)名患兒提供服務(wù),診前檢驗(yàn)訪問(wèn)量突破 6 萬(wàn)人次。
圖片
5) 曠視科技
聚焦物聯(lián)網(wǎng)場(chǎng)景,推動(dòng)人工智能的商業(yè)化落地。公司以物聯(lián)網(wǎng)作為人工智能技術(shù)落 地的載體,通過(guò)構(gòu)建完整的 AIoT 產(chǎn)品體系,面向消費(fèi)物聯(lián)網(wǎng)、城市物聯(lián)網(wǎng)、供應(yīng)鏈物 聯(lián)網(wǎng)三大核心場(chǎng)景提供經(jīng)驗(yàn)證的行業(yè)解決方案。公司的 AIoT 軟硬一體化解決方案包括 以 Brain++為核心的 AI 算法體系,由 AIoT 操作系統(tǒng)和行業(yè)應(yīng)用構(gòu)成的軟件,以及由 傳感器模組、傳感器終端與邊緣設(shè)備、機(jī)器人及自動(dòng)化裝備組成的硬件。消費(fèi)物聯(lián)網(wǎng):2012 年,曠視進(jìn)入消費(fèi)物聯(lián)網(wǎng)領(lǐng)域,以 SaaS 產(chǎn)品的形式服務(wù)全球開(kāi) 發(fā)者及企業(yè)用戶,為其提供數(shù)十種 AI 能力。隨著智能設(shè)備的普及,公司與多家頭部智能 手機(jī)廠商等消費(fèi)電子領(lǐng)域客戶開(kāi)展合作,累計(jì)為數(shù)億臺(tái)智能手機(jī)提供設(shè)備安全和計(jì)算攝 影解決方案。
5 算力與網(wǎng)絡(luò)是大模型運(yùn)行的必要條件
5.1 大模型發(fā)展,算力需求激增
前文提到,ChatGPT 從初代模型,到當(dāng)前的 3 代模型,參數(shù)量從 1.17 億,提升至 1750 億。同時(shí)訓(xùn)練數(shù)據(jù)量(語(yǔ)料庫(kù))也由 5GB 提升至 45TB。隨著參數(shù)量和語(yǔ)料庫(kù)指數(shù)級(jí)的擴(kuò)容,ChatGPT 類人工智能需要更充足的算力支持其 處理數(shù)據(jù),同時(shí)需要投入更多高性能的算力芯片來(lái)處理千億級(jí)別參數(shù)量。英偉達(dá)的研究 表示,GPT-3 模型需要使用 512 顆 V100 顯卡訓(xùn)練 7 個(gè)月時(shí)間,或者使用 1024 顆 A100 芯片訓(xùn)練長(zhǎng)達(dá)一個(gè)月的時(shí)間。2012 年以來(lái),人工智能訓(xùn)練任務(wù)中的算力增長(zhǎng)(所需算力 每 3.5 月翻一倍)已經(jīng)超越芯片產(chǎn)業(yè)長(zhǎng)期存在摩爾定律(晶體管數(shù)量每 18 月翻一倍)。
現(xiàn)階段國(guó)內(nèi)無(wú)法采購(gòu)英偉達(dá) A100、H100 等高端 GPU 產(chǎn)品,但算力性能上的差異 可以通過(guò)提升算力芯片數(shù)量來(lái)彌補(bǔ), 因此對(duì)于算力芯片產(chǎn)品的需求也將更高。國(guó)內(nèi)主流 互聯(lián)網(wǎng)廠商也有類 ChatGPT 產(chǎn)品正在開(kāi)發(fā),比如悟道和百度的文心等 AI 模型。隨著國(guó) 產(chǎn) GPU, CPU, FPGA 產(chǎn)品性能的提升,人工智能的算力需求將為國(guó)產(chǎn)芯片廠商打開(kāi)廣 闊的市場(chǎng)空間。同時(shí),以 ChatGPT 為代表的 AI 技術(shù)浪潮的到來(lái),對(duì)產(chǎn)業(yè)鏈相關(guān)芯片, 模組,材料等環(huán)節(jié)均帶來(lái)了海量的新需求。
5.2 GPU/GPGPU/FPGA 多路線支持算力
人工智能深度學(xué)習(xí)模型需要處理兩大任務(wù),即訓(xùn)練和推理。1) 訓(xùn)練就是學(xué)習(xí)過(guò)程,通過(guò)大數(shù)據(jù)訓(xùn)練出復(fù)雜的神經(jīng)網(wǎng)絡(luò)模型,使得整個(gè)系統(tǒng)可以適 應(yīng)特定的功能。因此,訓(xùn)練需要龐大的算力來(lái)處理數(shù)據(jù)并搭建網(wǎng)絡(luò)模型,所需的芯片需要具有高算力和通用性。2) 而推理在訓(xùn)練之后,主要是在已有的訓(xùn)練完善的模型基礎(chǔ)上,輸入新數(shù)據(jù)進(jìn)行推斷, 能耗、時(shí)延、效率等因素都是影響推理能力的因素。但同時(shí),推理環(huán)節(jié)不需要在龐 大的神經(jīng)網(wǎng)絡(luò)之中反復(fù)調(diào)整參數(shù),因此對(duì)算力的要求相對(duì)于訓(xùn)練要低很多。
一般來(lái)說(shuō),在深度學(xué)習(xí)的訓(xùn)練中,GPU 因?yàn)槠洳⑿写?lián)的優(yōu)勢(shì),相比較于 CPU 更 加適應(yīng)處理大數(shù)據(jù)。最早為了解放 CPU 處理其他任務(wù)和計(jì)算的需求,圖形計(jì)算全部交 由 GPU 來(lái)做。因此傳統(tǒng)的 GPU 的主要功能是做圖形渲染(實(shí)質(zhì)是做圖形渲染的計(jì)算), 但隨著 AI 計(jì)算需求的發(fā)展,GPGPU 應(yīng)運(yùn)而生,GPGPU 即為通用計(jì)算 GPU,指去掉 GPU 的圖形顯示部分,將其余部分全部投入通用計(jì)算,其在 AI、數(shù)據(jù)分析和 HPC 等場(chǎng) 景下可以廣泛應(yīng)用??偠灾?,通用 GPU 在加速硬件能力上的優(yōu)勢(shì)比較明顯,在深度學(xué) 習(xí)訓(xùn)練方面比較適用。根據(jù)相關(guān)市場(chǎng)統(tǒng)計(jì),全球 GPU 的市場(chǎng)已經(jīng)達(dá)到了 448 億美元的規(guī)模,在 AI 的發(fā)展 需求下,通用型 GPU 的市場(chǎng)正在快速成長(zhǎng)。
圖片
CPU 是計(jì)算機(jī)運(yùn)算和控制的核心,其工作原理是將指令依序執(zhí)行,其串行運(yùn)算的特 點(diǎn)使其更加適應(yīng)邏輯控制。因此在深度學(xué)習(xí)模型之中,CPU 搭配 GPU 是目前的主流方 案,但隨著各類算法在 FPGA/ ASIC 芯片上的優(yōu)化,以及其本身性能的提升和成本的優(yōu) 化,F(xiàn)PGA 和 ASIC 也會(huì)在人工智能領(lǐng)域上有著更廣的應(yīng)用?,F(xiàn)階段,可編程的 FPGA 芯片也逐漸提升市場(chǎng)份額。實(shí)際應(yīng)用中,微軟利用 FPGA 加速 Azure 云服務(wù)、必應(yīng)等數(shù)據(jù)中心服務(wù)中的實(shí)時(shí)人工智能。FPGA 具備快速、低功耗、 靈活和高效的優(yōu)點(diǎn)。硬件可編程的特性使得 FPGA 在 AI 訓(xùn)練中既能提供充足的算力, 又具有靈活性,可以重新編程以適應(yīng)不同任務(wù)的需要。與 GPU 類似,F(xiàn)PGA 也是配合 CPU 進(jìn)行加速。國(guó)內(nèi) FPGA 廠商中,紫光國(guó)微于 2022 年推出了 2x 納米的低功耗 FPGA 系列產(chǎn)品,新一代 1x 納米更高性能 FPGA 系列產(chǎn)品也在順利推進(jìn)中,進(jìn)一步完善了產(chǎn) 品種類。復(fù)旦微電具備 65nm 制程千萬(wàn)門級(jí)和 28nm 制程億門級(jí)產(chǎn)品,目前以 28nm 制 程的 FPGA 產(chǎn)品為主。安路科技的 FPGA 芯片產(chǎn)品形成了由 PHOENIX 高性能產(chǎn)品系 列、EAGLE 高效率產(chǎn)品系列、ELF 低功耗產(chǎn)品系列組成的產(chǎn)品矩陣。根據(jù)市場(chǎng)統(tǒng)計(jì),全球 FPGA 芯片規(guī)模在 79 億美元左右,隨著 AI 和軍工等下游行業(yè) 的需求增長(zhǎng),全球 FPGA 市場(chǎng)空間仍在持續(xù)上升之中。
5.3 高帶寬網(wǎng)絡(luò)是對(duì)人工智能算力的重要支撐
大模型訓(xùn)練和推理使用了 AI 計(jì)算集群。AI 大模型通常需要部署在 AI 計(jì)算集群以實(shí)現(xiàn)訓(xùn)練和推理加速并實(shí)現(xiàn)最佳能效比。以目前獨(dú)家開(kāi)放了 ChatGPT 調(diào)用能力的微軟 Azure 為例,其 AI 基礎(chǔ)設(shè)施由互聯(lián)的英偉達(dá) Ampere A100 Tensor Core GPU 組成,并 由 Quantum infiniBand 交換機(jī)提供強(qiáng)大的橫向擴(kuò)展能力。根據(jù)微軟宣布,為 OpenAI 開(kāi) 發(fā)的超級(jí)計(jì)算機(jī)超過(guò)了 28.5 萬(wàn)個(gè) CPU 核心、1 萬(wàn)個(gè) GPU,每臺(tái) GPU 服務(wù)器網(wǎng)絡(luò)連接 能力為 400Gbps,位列全球超級(jí)計(jì)算機(jī)前五。目前,英偉達(dá)的 AI 計(jì)算集群整體解決方 案(如 DGX A100 系列)是 AI 集群投資的主流選擇,除此之外部分云和互聯(lián)網(wǎng)大廠選 擇了 CPU+FPGA+GPU+AI DSA 異構(gòu)算力自己搭建 AI 計(jì)算中心。根據(jù) YOLE 預(yù)測(cè),全 球 AI 加速服務(wù)器滲透率將在 2027 年達(dá)到 17.9%,AI/GPU 加速服務(wù)器出貨量復(fù)合增速 高達(dá) 39.8%/20.3%。
后者是在設(shè)備轉(zhuǎn)發(fā)層面盡量?jī)?yōu)化網(wǎng)絡(luò)時(shí)延,實(shí)現(xiàn)高性能無(wú)損網(wǎng)絡(luò),目前主要手段是 無(wú)帶寬收斂(1:1)的網(wǎng)絡(luò)架構(gòu)設(shè)計(jì)以及基于 PFC 和 ECN 功能的優(yōu)先隊(duì)列管理和擁塞管 理。無(wú)帶寬收斂比設(shè)計(jì)意味著交換機(jī)下行和上行流量一致,將增加上行端口數(shù)量或端口 帶寬,而優(yōu)化流控技術(shù)需要可編程的三層網(wǎng)絡(luò)交換機(jī),以上將導(dǎo)致交換機(jī)端口數(shù)量增加 以及價(jià)值量提升。
圖片
在數(shù)據(jù)中心集群網(wǎng)絡(luò)方面,北美 Top4 云廠商已經(jīng)全面進(jìn)入 400G 部署階段。以微 軟數(shù)據(jù)中心為例,其在 2016 年開(kāi)始批量部署 100G,由于 AI 算力的快速增長(zhǎng),2021 年 開(kāi)啟 400G 部署,并預(yù)計(jì) 2024 完成 400G 的全面部署,加速向 800G 邁進(jìn)。而對(duì)于 400G 部署更早的亞馬遜和谷歌,預(yù)計(jì)在 2023 年開(kāi)啟小規(guī)模 800G 部署,更大的端口帶寬將 帶來(lái)更高的端口密度,節(jié)約空間的同時(shí)每 Gbps 成本下降。根據(jù) LightCounting 預(yù)測(cè),全 球數(shù)據(jù)中心以太網(wǎng)光模塊市場(chǎng)將在 2027 年突破 100 億美金,5 年 CAGR 11.5%,其中 800G CAGR 達(dá) 72%。
單機(jī)網(wǎng)卡數(shù)增加和網(wǎng)絡(luò)收斂比降低增加了交換機(jī)和光模塊用量。根據(jù)數(shù)據(jù)中心光模 塊需求量計(jì)算公式(流量法):1)服務(wù)器到 TOR 交換機(jī)光模塊:服務(wù)器網(wǎng)卡端口數(shù)*2 2)TOR 到 LEAF 交換機(jī)光模塊:服務(wù)器流量/一級(jí)收斂比/TOR 上聯(lián)端口速率*2 3)LEAF 到 SPINE 光模塊:LEAF 流量/二級(jí)收斂比./LEAF 上聯(lián)端口速率*2 假設(shè)普通 Hyperscale 數(shù)據(jù)中心和 AI 數(shù)據(jù)中心分別有 X 臺(tái)服務(wù)器,每臺(tái)服務(wù)器網(wǎng)卡 速率為 100Gbps,數(shù)量分別為 2/10,網(wǎng)絡(luò)收斂比分別為 2:1、1:1,交換機(jī)上聯(lián)端口速率 為 400G,計(jì)算得到普通 Hyperscale 數(shù)據(jù)中心光模塊(包括 AOC/DAC)用量為 4.75X, 而 AI 數(shù)據(jù)中心光模塊用量為 23.75x,光模塊用量大幅提升。
圖片
CPO 探討:一系列技術(shù)問(wèn)題的解決和產(chǎn)業(yè)鏈結(jié)構(gòu)的重塑。CPO(光電共封裝)的主 要形態(tài)為交換芯片與光引擎封裝在一塊基板上,交換芯片與光引擎通過(guò) XSR SerDes 直 聯(lián)。我們認(rèn)為 CPO 可能是數(shù)據(jù)中心交換機(jī)端口發(fā)展到 1.6Tbps 以上一種可能的光模塊 形態(tài),雖然 AI 算力將加速數(shù)據(jù)中心交換機(jī)帶寬的增長(zhǎng),但 CPO 的滲透仍將是個(gè)緩慢的 過(guò)程。CPO 主要解決的是高速 SerDes 信號(hào)衰減和功耗問(wèn)題(1.6T 光模塊可能使用 200G SerDes)、1.6T 光模塊多通道設(shè)計(jì)和良率難題以及相應(yīng)帶來(lái)的成本高企,但目前也有一 些問(wèn)題需要解決,比如光源設(shè)計(jì)問(wèn)題(如設(shè)計(jì)在交換機(jī)內(nèi)光引擎附近容易出現(xiàn)熱失效, 一種可能的思路為外置光源 ELS 但相應(yīng)也會(huì)帶來(lái)功耗的增加和布線的成本大幅提升)、 與交換機(jī)芯片的聯(lián)調(diào)問(wèn)題、以及將來(lái)的替換維護(hù)問(wèn)題(需拆機(jī)維護(hù))。我們認(rèn)為,CPO 或 將重塑數(shù)通產(chǎn)業(yè)鏈結(jié)構(gòu),話語(yǔ)權(quán)可能會(huì)向交換芯片廠商、交換機(jī)廠商傾斜,同時(shí)光引擎 封裝、硅光芯片、保偏光纖、CW 激光器、封裝基板等環(huán)節(jié)也將成為新增投資機(jī)會(huì)。
5.4 量子計(jì)算有望成為 AI 算力突破的“神助攻”
量子計(jì)算產(chǎn)業(yè)蓬勃發(fā)展。量子計(jì)算機(jī)基于量子力學(xué)原理構(gòu)建,量子態(tài)疊加原理使得 量子計(jì)算機(jī)的每個(gè)量子比特(qubit)能夠同時(shí)表示二進(jìn)制中的 0 和 1,相較經(jīng)典計(jì)算機(jī) 算力呈指數(shù)級(jí)爆發(fā)式增長(zhǎng)。目前量子計(jì)算機(jī)已被證明在特定計(jì)算任務(wù)上具備指數(shù)加速能 力,即實(shí)現(xiàn)所謂的“量子霸權(quán)”,目前量子計(jì)算產(chǎn)業(yè)化需要解決的三大目標(biāo)一是開(kāi)發(fā)大規(guī)模 可容錯(cuò)的量子計(jì)算機(jī)以盡快實(shí)現(xiàn)可編程計(jì)算;二是開(kāi)發(fā)精妙的量子計(jì)算算法以實(shí)現(xiàn)在特 定場(chǎng)景的商業(yè)化價(jià)值;三是解決量子計(jì)算資源稀缺性難題,通過(guò)云平臺(tái)提升綜合性普惠 服務(wù)能力。根據(jù) Hyperion Research 最新展望,全球量子計(jì)算市場(chǎng) 2022 年市場(chǎng)規(guī)模 6.14 億美 元,預(yù)計(jì)到 2025 年達(dá)到 12.08 億美元,CAGR 25%,其中機(jī)器學(xué)習(xí)市場(chǎng)占比 25%,被 認(rèn)為是最有潛力的應(yīng)用市場(chǎng)之一。
圖片
量子計(jì)算在 AI 的應(yīng)用處于探索初期,發(fā)現(xiàn)部分算法可能有優(yōu)勢(shì),但還沒(méi)實(shí)現(xiàn)量子 霸權(quán)。神經(jīng)網(wǎng)絡(luò)和機(jī)器人學(xué)習(xí)系統(tǒng)的發(fā)展依賴于算力的進(jìn)步以及龐大的訓(xùn)練數(shù)據(jù)量積累, 隨著摩爾定律演進(jìn)的放緩以及“內(nèi)存墻”等經(jīng)典計(jì)算機(jī)架構(gòu)原因,算力增長(zhǎng)正在放緩,而隱 私問(wèn)題&數(shù)據(jù)標(biāo)注成本也阻礙大數(shù)據(jù)的無(wú)限度獲取。目前,產(chǎn)業(yè)界認(rèn)為量子計(jì)算可能會(huì)成 為機(jī)器學(xué)習(xí)發(fā)展的“神助攻”或開(kāi)辟嶄新的量子機(jī)器學(xué)習(xí)領(lǐng)域。一是量子計(jì)算機(jī)本身的工作架構(gòu)可被看做一個(gè)神經(jīng)網(wǎng)絡(luò)(N 個(gè) Qubit 可代表 2 的 N 次方個(gè)神經(jīng)元),麻省理工大學(xué)物理學(xué)家 Lloyd 估計(jì),60 個(gè) Qubit 量子計(jì)算機(jī)可以編碼 的數(shù)據(jù)量就相當(dāng)于人類一年生成的所有數(shù)據(jù),而神經(jīng)網(wǎng)絡(luò)運(yùn)算相當(dāng)于同時(shí)對(duì)這些“神經(jīng)元” 對(duì)矩陣運(yùn)算。二是傳統(tǒng)神經(jīng)網(wǎng)絡(luò)初始層導(dǎo)入輸入的樣本將被中間層生成不同組合形式的 輸入,而采用量子比特編碼的數(shù)據(jù)集數(shù)量和多樣性都有可能擴(kuò)大和豐富從而可能更好地 訓(xùn)練模型。目前學(xué)術(shù)界探討的可能展現(xiàn)出優(yōu)勢(shì)的人工智能算法包括決策問(wèn)題、搜索問(wèn)題、 博弈理論、自然語(yǔ)言處理、貝葉斯網(wǎng)絡(luò)、模式識(shí)別等,但由于目前還無(wú)法成功解決模型 的初始參數(shù)輸入以及準(zhǔn)確的結(jié)果測(cè)量手段等問(wèn)題,量子計(jì)算機(jī)在以上人工智能算法上還 未展現(xiàn)出“量子霸權(quán)”優(yōu)勢(shì)。
量子計(jì)算加速 NLP 成為最被看好的前沿應(yīng)用領(lǐng)域。作為目前爆火的 AI 大模型, ChatGPT 是自然語(yǔ)言處理(NLP)的創(chuàng)新成果,結(jié)合了語(yǔ)言學(xué)、計(jì)算機(jī)和人工智能,以 理解和模仿人類如何使用語(yǔ)言。量子計(jì)算在 NLP 大型復(fù)雜數(shù)據(jù)集處理中可能具有價(jià)值, Omdia 首席量子計(jì)算分析師 Sam Lucero 認(rèn)為量子計(jì)算將在 NLP 中發(fā)揮作用,最終在 ChatGPT 和 AIGC 中發(fā)揮作用,該研究分支被稱作 QNLP。根據(jù)啟科量子研究,QNLP 可能存在以下優(yōu)勢(shì):1)NLP 的主要任務(wù)即相關(guān)搜索或 任務(wù)分類的算法加速;2)指數(shù)級(jí)的量子狀態(tài)空間適用于更加復(fù)雜的語(yǔ)言結(jié)構(gòu);3)運(yùn)用 密度矩陣的新型意義模型自然地模擬了諸如下義關(guān)系和語(yǔ)言歧義等語(yǔ)言現(xiàn)象;4)可以大 大提高訓(xùn)練效率,用更少的訓(xùn)練數(shù)據(jù)達(dá)到相同的能力水平。2020 年初,劍橋量子計(jì)算公 司(CQC)宣布首次在量子計(jì)算機(jī)上執(zhí)行自然語(yǔ)言處理測(cè)試并獲得成功,他們通過(guò)將語(yǔ) 法句子翻譯成量子電路,然后在量子計(jì)算機(jī)上實(shí)現(xiàn)生成的程序執(zhí)行問(wèn)答,發(fā)現(xiàn)了在含噪 聲中等規(guī)模量子計(jì)算時(shí)代獲得量子優(yōu)勢(shì)的途徑。
5.5 相關(guān)標(biāo)的
1) 海光信息:國(guó)產(chǎn) CPU 與 GPGPU 重要參與者
海光信息是一家以 CPU 和 DCU 產(chǎn)品為主的芯片設(shè)計(jì)廠商,公司多款產(chǎn)品性能達(dá)到 了國(guó)際同類型主流高端處理器的水平。CPU 類產(chǎn)品兼容國(guó)際主流 x86 處理器架構(gòu)和技術(shù) 路線以及國(guó)際上主流操作系統(tǒng)和應(yīng)用軟件,軟硬件生態(tài)完善,可靠性和安全性較高,得 到終端客戶的認(rèn)可,已經(jīng)廣泛應(yīng)用于運(yùn)營(yíng)商、金融、互聯(lián)網(wǎng)、教育等重要行業(yè)及領(lǐng)域。海光 DCU 系列產(chǎn)品以 GPGPU 架構(gòu)為基礎(chǔ),兼容通用的“類 CUDA”環(huán)境以及國(guó)際主 流商業(yè)計(jì)算軟件和人工智能軟件,軟硬件生態(tài)豐富,可廣泛應(yīng)用于大數(shù)據(jù)處理、人工智 能、商業(yè)計(jì)算等應(yīng)用領(lǐng)域。在 ChatGPT 等應(yīng)用場(chǎng)景下的所指的 GPU 即為 GPGPU,去掉 GPU 為了圖形處理 而設(shè)計(jì)的加速硬件單元,保留了 GPU 的 SIMT 架構(gòu)和通用計(jì)算單元。所以對(duì)于 ChatGPT 場(chǎng)景下的 AI 訓(xùn)練、矩陣運(yùn)算等通用計(jì)算類型的任務(wù)仍然保留了 GPU 的優(yōu)勢(shì),即高效搬 運(yùn),運(yùn)算,重復(fù)性的有海量數(shù)據(jù)的任務(wù)。
圖片
2) 復(fù)旦微電:FPGA 受益算力增長(zhǎng)
復(fù)旦微電的 FPGA 產(chǎn)品線擁有系列化超大規(guī)模異構(gòu)融合可編程邏輯器件系列產(chǎn)品, 公司在國(guó)內(nèi)較早的推出了億門級(jí) FPGA 和異構(gòu)融合可編程片上系統(tǒng)(PSoC)芯片,以 及面向人工智能應(yīng)用的 FPGA 和 AI 的可重構(gòu)芯片(FPAI)。公司累計(jì)向超過(guò) 500 家客戶銷售相關(guān) FPGA 產(chǎn)品,在通信領(lǐng)域、工業(yè)控制領(lǐng)域等得到廣泛應(yīng)用。
FPGA 在人工智能加速卡領(lǐng)域應(yīng)用廣泛。FPGA 通過(guò)與 CPU 搭配,CPU 的部分?jǐn)?shù) 據(jù)運(yùn)算轉(zhuǎn)移給 FPGA,最終 FPGA 起到加速作用。無(wú)論是賽靈思還是英特爾,其 FPGA 在數(shù)據(jù)中心運(yùn)算方面的產(chǎn)品形態(tài)均為加速卡,在服務(wù)器中與 CPU 進(jìn)行配合。人工智能領(lǐng) 域?qū)儆诩铀儆?jì)算的一個(gè)分支,如阿里云、騰訊云之類的數(shù)據(jù)中心均對(duì)加速卡存在大量需 求. 根據(jù)人工智能的不同應(yīng)用領(lǐng)域,可將各種算力需求和控制邏輯用最合適的資源組合 實(shí)現(xiàn),在這一過(guò)程中,F(xiàn)PGA 在其中起到了關(guān)鍵作用??傮w而言,F(xiàn)PGA 具備快速、低 功耗、靈活和高效的優(yōu)點(diǎn)。硬件可編程的特性使得 FPGA 在 AI 訓(xùn)練中既能提供充足的 算力,又具有靈活性,可以重新編程以適應(yīng)不同任務(wù)的需要。
3) 中際旭創(chuàng):全球光模塊龍頭迎來(lái) 800G 時(shí)代
中際旭創(chuàng)是全球高速數(shù)通光模塊龍頭,在 Top5 云計(jì)算公司光模塊供應(yīng)商中占據(jù)最 大份額,根據(jù) LightCounting 統(tǒng)計(jì),公司在 2021 全球光模塊市場(chǎng)位列第一。全球云巨頭 數(shù)據(jù)中心網(wǎng)絡(luò)部署正處于 400G 批量部署、800G 小批量上量階段,公司 800G 全系列 產(chǎn)品已實(shí)現(xiàn)供貨,800G 時(shí)代有望維持龍頭地位,并將享受 400G、800G 高端產(chǎn)品收入 占比增加帶來(lái)的綜合毛利率提升。此外,公司布局硅光、CPO 等前沿技術(shù),硅光/EML 兩 種平臺(tái) 400G 光模塊均通過(guò)客戶驗(yàn)證,未來(lái)有望把持產(chǎn)業(yè)鏈上游核心環(huán)節(jié),實(shí)現(xiàn)供應(yīng)鏈 穩(wěn)定。在電信市場(chǎng),公司戰(zhàn)略進(jìn)軍相干高端光模塊,已在國(guó)內(nèi)主要設(shè)備商實(shí)現(xiàn)供貨,有 望開(kāi)啟第二增長(zhǎng)曲線。
4) 聯(lián)特科技:歐美中低速 WDM 主流供應(yīng)商,數(shù)通光模塊“黑馬”
聯(lián)特科技在海外市場(chǎng)主打差異化競(jìng)爭(zhēng)優(yōu)勢(shì),經(jīng)歷 10 年積累,在 WDM 細(xì)分市場(chǎng)占 據(jù)了優(yōu)勢(shì)地位,主要客戶包括愛(ài)立信、諾基亞、Prolabs、Adtran 等。隨著歐美疫后通信 新基建投資增加,原有城域網(wǎng)持續(xù)速率升級(jí),公司在客戶份額有望繼續(xù)提升。此外,海 外發(fā)達(dá)國(guó)家 RAN 市場(chǎng),愛(ài)立信、諾基亞兩家占據(jù)主導(dǎo)地位,公司作為愛(ài)立信前傳光模塊 主要供應(yīng)商之一收入持續(xù)增長(zhǎng)。數(shù)通方面,近幾年?duì)I收快速增長(zhǎng),2021 年?duì)I收達(dá) 3.3 億 元,同比增長(zhǎng) 33%,在整體收入中占比近半。公司已成為思科、Arista 等海外主流設(shè)備 商合格供應(yīng)商,100G/400G 高速光模塊產(chǎn)品持續(xù)上量,并有望在 2023 突破北美 Top4 云廠商客戶。公司前瞻布局 800G 和 CPO 產(chǎn)品,目前已推出基于 EML、SiP、TFLN 全 系列 800G 產(chǎn)品,EML 預(yù)計(jì) 2023 年在客戶端完成全面認(rèn)證。
5) 天孚通信:光通信精益制造代表,光引擎、激光雷達(dá)成長(zhǎng)速度快
天孚通信定位于光器件整體解決方案提供商 OMS,目前擁有十三大產(chǎn)品線、八大解 決方案,幾乎涵蓋光模塊生產(chǎn)所需的所有無(wú)源光器件、各種有源封裝形態(tài)等。公司 2022 年業(yè)績(jī)快報(bào)預(yù)計(jì)實(shí)現(xiàn)收入 12.06 億元,同比增長(zhǎng) 16.8%,五年 CAGR 29.1%,歸母業(yè)績(jī) 29.2%。公司將持續(xù)優(yōu)化無(wú)源產(chǎn)品線結(jié)構(gòu),拓展新客戶的同時(shí)提供一站式解決方案增加 單客戶價(jià)值量,未來(lái)無(wú)源產(chǎn)品有望保持高于行業(yè)的平均增速和毛利率;有源方面,公司 戰(zhàn)略聚焦高速數(shù)通領(lǐng)域,與大客戶合作的硅光引擎快速上量,將受益于 800G、1.6T 硅 光、CPO 等新技術(shù)滲透率提升。此外,公司在激光雷達(dá)領(lǐng)域秉持精益制造理念,提供濾 波片、透鏡、棱鏡等無(wú)源光器件以及模組化解決方案代工,目前在國(guó)內(nèi)主流新勢(shì)力車型 已取得定點(diǎn),未來(lái)兩年將持續(xù)放量。
6) 國(guó)盾量子:量子計(jì)算機(jī)已實(shí)現(xiàn)原型機(jī)搭建
公司核心技術(shù)來(lái)源于中科大產(chǎn)業(yè)化平臺(tái),是全球量子通信 QKD 設(shè)備龍頭企業(yè)。公 司在國(guó)內(nèi)量子通信骨干網(wǎng)一期建設(shè)中占據(jù)了主要的設(shè)備份額,其骨干網(wǎng)/城域網(wǎng) QKD 編 碼產(chǎn)品、量子衛(wèi)星地面站產(chǎn)品、信道與密鑰組網(wǎng)交換產(chǎn)品已批量部署。我們認(rèn)為,隨著 國(guó)內(nèi)經(jīng)濟(jì)的全面復(fù)蘇,量子骨干網(wǎng)二期有望啟動(dòng),同時(shí)公司在電力、電信、金融等領(lǐng)域 與大型央國(guó)企簽訂戰(zhàn)略合作協(xié)議,隨著各行業(yè)對(duì)保密通信的重視,有望開(kāi)啟更加廣闊的 行業(yè)市場(chǎng)。公司在量子計(jì)算領(lǐng)域主要提供超導(dǎo)量子計(jì)算低溫線纜組件、約瑟夫森阻抗?jié)u 變參量放大器、ez-Q Engine 超導(dǎo)量子計(jì)算操控系統(tǒng)等子系統(tǒng)和器件,其超導(dǎo)量子計(jì)算 操控系統(tǒng)成功主力“祖沖之號(hào)”實(shí)現(xiàn)量子優(yōu)越性展示。公司日前完成了“祖沖之二號(hào)”同等規(guī) 模超導(dǎo)量子計(jì)算機(jī)原型機(jī)搭建,是國(guó)內(nèi)目前唯一具有量子計(jì)算機(jī)整機(jī)集成能力的上市公 司,未來(lái)將通過(guò)平臺(tái)的形式率先提供服務(wù)。
7) 浪潮信息:國(guó)內(nèi)領(lǐng)先 AI 服務(wù)器廠商
公司是全球領(lǐng)先的新型 IT 基礎(chǔ)架構(gòu)產(chǎn)品、方案及服務(wù)提供商,以“智慧計(jì)算”為戰(zhàn)略, 通過(guò)“硬件重構(gòu)+ 軟件定義”的算力產(chǎn)品和解決方案、構(gòu)建開(kāi)放融合的計(jì)算生態(tài),為客戶 構(gòu)建滿足多樣化場(chǎng)景的智慧計(jì)算平臺(tái),全面推動(dòng)人工智能、大數(shù)據(jù)、云計(jì)算、物聯(lián)網(wǎng)的 廣泛應(yīng)用和對(duì)傳統(tǒng)產(chǎn)業(yè)的數(shù)字化變革與重塑。當(dāng)前業(yè)務(wù)包括傳統(tǒng)服務(wù)器、AI 服務(wù)器及存儲(chǔ)產(chǎn)品。根據(jù) IDC 最新數(shù)據(jù),浪潮信息的服務(wù)器產(chǎn)品 2021 年全年位居全球前二,持續(xù)以 30%+的市占率領(lǐng)跑中國(guó)市場(chǎng);AI 服務(wù)器方面,根據(jù) IDC 數(shù)據(jù),2021 年全年,中國(guó) AI 服務(wù)器市場(chǎng)規(guī)模達(dá) 350.3 億 元,同比增長(zhǎng) 68.6%。從廠商維度看,浪潮信息、寧暢、新華三、華為、安擎位居前五, 占據(jù)了 82.6%的市場(chǎng)份額。其中,浪潮 AI 服務(wù)器市場(chǎng)占有率達(dá) 52.4%。2021 年,公司 發(fā)布首款智算中心調(diào)度系統(tǒng) AIStation,擁有性能最強(qiáng)的液冷 AI 服務(wù)器 NF5488LA5,發(fā) 布 2457 億參數(shù)的 AI 巨量模型“源 1.0”。
6 從元宇宙到大制造,大模型應(yīng)用領(lǐng)域不斷豐富
6.1 “生成式 AI”在互聯(lián)網(wǎng)及元宇宙應(yīng)用
“生成式 AI (generative AI)”在互聯(lián)網(wǎng)及元宇宙領(lǐng)域市場(chǎng)化空間較為廣闊。基于現(xiàn)行 的 NLP 算法發(fā)展程度及數(shù)據(jù)集規(guī)模,在不久的將來(lái),生成式 AI 有較大可能在“智能客服” 和“搜索引擎”進(jìn)行增值,并有希望以“插件”的形式賦能現(xiàn)有的“生產(chǎn)力工具鏈(工程軟件/音 視頻制作工具等)”。在為客服領(lǐng)域增值的過(guò)程中,有希望在人工客服的全鏈路中(包括問(wèn)題識(shí)別、潛在 解決方案交付、反饋優(yōu)化、和風(fēng)險(xiǎn)識(shí)別等)實(shí)現(xiàn)對(duì)人工客服的替代。可實(shí)現(xiàn)替代的領(lǐng)域 包括電商零售、醫(yī)療健康、金融服務(wù)、和電信等領(lǐng)域的客服環(huán)節(jié)。
1) “生成式 AI”在智能客服領(lǐng)域的潛在應(yīng)用
“可對(duì)話 AI(Conversational AI)”是“生成式 AI”在智能客服領(lǐng)域的直接應(yīng)用。根據(jù) Grand View Research,全球“可對(duì)話 AI(Conversational AI)”2021 年市場(chǎng)空間為 62 億美 元,其中,BFSI(銀行保險(xiǎn)等金融服務(wù)),醫(yī)療,零售和電商,和電信領(lǐng)域的市場(chǎng)空間為 42.5 億美元左右,占 68.5%左右;根據(jù) Grand View Research 預(yù)測(cè),2030 年“可對(duì)話 AI” 的市場(chǎng)空間將達(dá)到約 413.9 億美元,對(duì)應(yīng) 2022 至 2030 年復(fù)合增長(zhǎng)率(CAGR)為 23.6%。該領(lǐng)域的核心競(jìng)爭(zhēng)者包括:谷歌,微軟,亞馬遜,IBM,甲骨文,和 SAP 等。市場(chǎng)增長(zhǎng) 的主要驅(qū)動(dòng)因素包括各領(lǐng)域?qū)τ趹?yīng)用 AI 技術(shù)替代人力這一需求的提升,和持續(xù)下降的 AI 對(duì)話程序的研發(fā)成本。
圖片
我們判斷,從現(xiàn)在起至未來(lái)幾年,作為 “ 生 成 式 AI” 重 要 應(yīng) 用 的 “ 對(duì) 話 AI(Conversational AI)”的商業(yè)化模式中較為清晰且可行的,是在各個(gè)領(lǐng)域?qū)τ谌斯た头?的替代。對(duì)人工客服進(jìn)行替代的假設(shè)是基于以下 3 點(diǎn)考慮:1、全球主要發(fā)達(dá)經(jīng)濟(jì)體人口 增長(zhǎng)乏力,勞動(dòng)力數(shù)量減少,用工成本攀升,有強(qiáng)烈的使用 AI 對(duì)話機(jī)器人替代人工客服 的需求;2、“智能對(duì)話機(jī)器人”相比“人工客服”可以創(chuàng)造更多價(jià)值,即,機(jī)器人可以完成 更多人工客服無(wú)法勝任的任務(wù),并且工作效率高,解決問(wèn)題出錯(cuò)率較低。3、“智能對(duì)話 機(jī)器人”研發(fā)和部署成本的有希望隨著算力提升或者異構(gòu)運(yùn)算的發(fā)展而逐步下降,同時(shí)該 機(jī)器人的實(shí)踐經(jīng)驗(yàn)的可復(fù)制性不斷提高。由于電商、醫(yī)療健康、BFSI、和電信網(wǎng)絡(luò)服務(wù) 的客服服務(wù)中產(chǎn)生的問(wèn)題及解答,較為結(jié)構(gòu)化并依賴勞動(dòng)力密集產(chǎn)出(其中,醫(yī)療健康 領(lǐng)域不包括醫(yī)生看診環(huán)節(jié),僅包括掛號(hào)預(yù)約、初步咨詢、取藥、和護(hù)理服務(wù)溝通等專業(yè) 性較低環(huán)節(jié)),所以這 4 個(gè)應(yīng)用領(lǐng)域有望成為“可對(duì)話 AI”可以進(jìn)行“人力資源替代”的主要 領(lǐng)域。我們從這 4 個(gè)主要領(lǐng)域入手,基于對(duì)未來(lái)驅(qū)動(dòng)因素的假設(shè),進(jìn)行了市場(chǎng)空間測(cè)算。根據(jù) Grand View Research,2021 年這 4 個(gè)主要領(lǐng)域市場(chǎng)空間約為 42.5 億美元左右;基于此作為起點(diǎn),經(jīng)過(guò)我們的測(cè)算,2033 年這 4 大主要領(lǐng)域的市場(chǎng)空間可以達(dá)到 478 億美元。
2) “生成式 AI”在搜索引擎領(lǐng)域的潛在應(yīng)用
在互聯(lián)網(wǎng)搜索領(lǐng)域,目前谷歌占據(jù)絕對(duì)的領(lǐng)軍地位。谷歌主要的業(yè)務(wù)板塊是谷歌服 務(wù)(Google Services),2022 年谷歌服務(wù)收入 2535.28 億美元。谷歌服務(wù)依賴谷歌在搜索 引擎領(lǐng)域長(zhǎng)期積累的技術(shù)和商業(yè)化優(yōu)勢(shì),包括搜索,Youtube,google play 智能手機(jī)平 臺(tái),廣告,瀏覽器,郵箱,云盤等。在考慮未來(lái)“生成式 AI”在搜索領(lǐng)域可以實(shí)現(xiàn)的收入時(shí),考慮范圍應(yīng)該不局限于“搜索 引擎”本身,還應(yīng)該包括基于“搜索引擎”技術(shù)所拓展出的外延部分,比如 Youtube,GoogleMap 和 Google Play 等;這些搜索引擎外延部分的商業(yè)化表現(xiàn),本質(zhì)是基于平臺(tái)是否可 以基于用戶的搜索請(qǐng)求或者使用習(xí)慣,將產(chǎn)品及服務(wù)較精準(zhǔn)的分發(fā)給用戶,然后用戶并 為此付費(fèi)。所以,谷歌服務(wù)部分的收入天花板,可以用來(lái)作為“標(biāo)尺”去衡量未來(lái)智能對(duì)話 機(jī)器人在“搜索領(lǐng)域”的潛在收入中最易于理解的部分。
2023 年 2 月初,微軟公布新 Bing (New Bing)搜索引擎,該版本搜索引擎集成了 ChatGPT 技術(shù),公布不到 48 小時(shí),申請(qǐng)用戶量已經(jīng)過(guò)百萬(wàn)。用戶需要排隊(duì)注冊(cè)申請(qǐng)并 等待獲得使用新 Bing 測(cè)試版的資格。根據(jù)微軟官方的解釋,新 Bing 可以作為類似研究 助理(research assistant),個(gè)人計(jì)劃員(personal planner),和創(chuàng)意合作伙伴(creative partner)的角色為用戶創(chuàng)造價(jià)值。和常規(guī)的搜索引擎相比,新 Bing 的搜索結(jié)果將不再是 簡(jiǎn)單的提供給用戶一個(gè)鏈接列表,而是給用戶一個(gè)概括的答案,解決用戶的具體問(wèn)題, 并且提供可靠的信息來(lái)源。用戶可以按照思考和溝通的方式與新 Bing 對(duì)話。同時(shí),新Bing 也可以作為創(chuàng)意工具,幫助用戶寫(xiě)詩(shī),寫(xiě)故事或者寫(xiě)分享關(guān)于項(xiàng)目的想法。根據(jù) The Verge 發(fā)布的新 Bing 測(cè)試使用體驗(yàn),用戶可以直接向 Bing 提問(wèn)如何幫助自己規(guī)劃一個(gè) 在紐約市 3 日的旅行,同時(shí)確保自己可以待在紐約時(shí)代廣場(chǎng)附近;而新 Bing 的回復(fù)可以 做到將酒店的選擇按照一定優(yōu)先級(jí)為用戶規(guī)劃出來(lái)。
圖片
2023 年 2 月初,谷歌也發(fā)布了谷歌巴德(Google Bard)生成式可對(duì)話 AI。使用了谷 歌的 LaMDA(Language Model for Dialogue Applications)模型。但是谷歌巴德發(fā)布之后, 并沒(méi)有達(dá)到用戶的期待。之后,谷歌母公司 Alphabet 主席 John Hennessy 稱,谷歌之 前在猶豫是否要將 Bard 應(yīng)用于產(chǎn)品中,因?yàn)?Bard 還沒(méi)有真的準(zhǔn)備好。同時(shí),百度也與同一時(shí)期官宣了“文心一言(ERNIE Bot)”即將于 2023 年 3 月完成內(nèi) 測(cè),屆時(shí)將向公眾開(kāi)放。之后,上海報(bào)業(yè)集團(tuán),36 氪,廣州日?qǐng)?bào),愛(ài)奇藝,度小滿,攜 程等媒體及互聯(lián)網(wǎng)產(chǎn)品和平臺(tái)均宣布接入文心一言。文心一言采用文心大模型,文心大 模型的 API 包括 ERNIE 3.0 文本理解與創(chuàng)作,ERNIE-ViLG 文生圖和 PLATO 開(kāi)放域?qū)?話服務(wù)。
6.2 AI 賦能制造業(yè)轉(zhuǎn)型升級(jí),智能制造浪潮興起
物聯(lián)網(wǎng)、大數(shù)據(jù)、云計(jì)算等技術(shù)日益成熟,人工智能已成為新時(shí)代的風(fēng)口浪尖,“人 工智能+”也代表一種新的社會(huì)形態(tài)。智能制造是實(shí)現(xiàn)制造強(qiáng)國(guó)的主攻方向,更是提升制 造業(yè)競(jìng)爭(zhēng)力的核心技術(shù)。隨著智能制造的浪潮興起,人工智能技術(shù)已貫穿于制造業(yè)設(shè)計(jì)、 生產(chǎn)、管理等諸多環(huán)節(jié)。從必要性看,在勞動(dòng)力及土地成本雙升的背景下,制造業(yè)面臨 著利潤(rùn)低、市場(chǎng)變化迅速等壓力,而人工智能的應(yīng)用不僅可以幫助企業(yè)提升智能化運(yùn)營(yíng) 水平,實(shí)現(xiàn)降本增效,還可以通過(guò)與其他新興技術(shù)的融合,推動(dòng)制造業(yè)模式升級(jí)及價(jià)值 鏈重構(gòu)。從實(shí)際應(yīng)用來(lái)看,人工智能在制造業(yè)的應(yīng)用可分為三方面:1)智能裝備:指具 有感知、分析、推理、決策、控制功能的制造裝備,典型代表有工業(yè)機(jī)器人、協(xié)作機(jī)器 人、數(shù)控機(jī)床等;2)智能工廠:利用各種現(xiàn)代化的技術(shù),實(shí)現(xiàn)工廠的辦公、管理及生產(chǎn) 自動(dòng)化,典型的代表場(chǎng)景有協(xié)作機(jī)器人、智能倉(cāng)儲(chǔ)物流系統(tǒng)等;3)智能服務(wù):指?jìng)€(gè)性化 定制、遠(yuǎn)程運(yùn)維及預(yù)測(cè)性維護(hù)等,典型代表有工業(yè)互聯(lián)網(wǎng)等。
1) 智能裝備產(chǎn)業(yè)百花齊放,工業(yè)機(jī)器人與高端數(shù)控機(jī)床空間廣闊
工業(yè)機(jī)器人
工業(yè)機(jī)器人種類眾多,貫穿工業(yè)生產(chǎn)的諸多工藝過(guò)程。工業(yè)機(jī)器人是廣泛用于工業(yè) 領(lǐng)域的多關(guān)節(jié)機(jī)械手或多自由度的機(jī)器裝置,具有一定的自動(dòng)性,可依靠自身的動(dòng)力能 源和控制能力實(shí)現(xiàn)各種工業(yè)加工制造功能。從構(gòu)成來(lái)看,其主要分為三大模塊:傳感模 塊、控制模塊和機(jī)械模塊。其中傳感模塊負(fù)責(zé)感知內(nèi)部和外部的信息,控制模塊控制機(jī) 器人完成各種活動(dòng),機(jī)械模塊接受控制指令實(shí)現(xiàn)各種動(dòng)作。從種類來(lái)看,工業(yè)機(jī)器人可 分為搬運(yùn)作業(yè)/上下料機(jī)器人、焊接機(jī)器人、噴涂機(jī)器人、加工機(jī)器人、裝備機(jī)器人、潔 凈機(jī)器人及其他,貫穿于工業(yè)生產(chǎn)過(guò)程中從材料和零部件入庫(kù)到生產(chǎn)再到最終產(chǎn)品出庫(kù) 的諸多環(huán)節(jié)。根據(jù)億歐智庫(kù)整理數(shù)據(jù),2021 年搬運(yùn)機(jī)器人和焊接機(jī)器人占比最高,分別 達(dá) 55%和 25%。從功能上看,較人工和傳統(tǒng)機(jī)器而言,不論哪一類工業(yè)機(jī)器人,在實(shí)際 生產(chǎn)中都具備成本、效率、安全等眾多優(yōu)勢(shì)。因此,我們認(rèn)為,隨著核心零部件和核心 技術(shù)的快速發(fā)展,工業(yè)機(jī)器人市場(chǎng)有望迎來(lái)快速發(fā)展。
圖片
高端數(shù)控機(jī)床
數(shù)控機(jī)床是一種裝有程序控制系統(tǒng)的自動(dòng)化機(jī)床,具備柔性和高效能的特點(diǎn)。近年 來(lái)國(guó)內(nèi)數(shù)控機(jī)床技術(shù)在高速化、復(fù)合化、精密化、多軸化等方面取得了重要突破,高端 數(shù)控機(jī)床產(chǎn)業(yè)發(fā)展迅速。從組成來(lái)看,高端數(shù)控機(jī)床包括加工程序載體、數(shù)控裝置、伺 服系統(tǒng)、機(jī)床主體和其他輔助裝置。具體來(lái)看:1)加工程序載體。即以一定的格式和代 碼存儲(chǔ)零件加工程序,從而對(duì)數(shù)控機(jī)床進(jìn)行控制。2)數(shù)控裝置。屬于數(shù)控機(jī)床的核心, 多采用 CNC 系統(tǒng),通過(guò)計(jì)算機(jī)系統(tǒng)程序的合理組織,整個(gè)系統(tǒng)協(xié)調(diào)的進(jìn)行工作。3)伺 服與測(cè)量反饋系統(tǒng)。主要用于實(shí)現(xiàn)數(shù)控機(jī)床的伺服控制,包括驅(qū)動(dòng)裝置和執(zhí)行機(jī)構(gòu)兩大 部分。4)機(jī)床主機(jī)。指在數(shù)控機(jī)床上自動(dòng)地完成各種切削加工的機(jī)械部分,包括床身、 底座、立柱、滑座、主軸箱、刀架等機(jī)械部件。5)其他輔助裝置。證充分發(fā)揮數(shù)控機(jī)床 功能所必需的配套裝置,常用的輔助裝置包括:氣動(dòng)、液壓裝置,排屑裝置,冷卻、潤(rùn) 滑裝置等。
數(shù)控機(jī)床優(yōu)勢(shì)明顯,后疫情時(shí)代市場(chǎng)規(guī)?;謴?fù)增長(zhǎng)。與普通機(jī)床相比,數(shù)控機(jī)床的 優(yōu)點(diǎn)眾多,具體來(lái)看:1)高度柔性。在數(shù)控機(jī)床上加工零件,主要取決于加工程序,因 此其適用于所加工的零件頻繁更換的場(chǎng)合,能較大程度縮短生產(chǎn)周期并節(jié)省費(fèi)用。2)加 工精度高。數(shù)控機(jī)床是按數(shù)字信號(hào)形式控制的,加工精度更高。3)加工質(zhì)量穩(wěn)定、可靠。4)生產(chǎn)率高。數(shù)控機(jī)床可有效地減少零件的加工時(shí)間和輔助時(shí)間。因此,高端數(shù)控機(jī)床 正廣泛應(yīng)用于大制造領(lǐng)域。從市場(chǎng)規(guī)模來(lái)看,根據(jù)中商產(chǎn)業(yè)研究院統(tǒng)計(jì)數(shù)據(jù)顯示,2019 年我國(guó)數(shù)控機(jī)床市場(chǎng)規(guī)模達(dá) 3270 億元,但 2019 年后,受疫情影響,2020 年國(guó)內(nèi)數(shù)控 機(jī)床市場(chǎng)規(guī)??s減至 2473 億元。受益于國(guó)內(nèi)疫情控制良好,各行業(yè)開(kāi)始復(fù)工復(fù)產(chǎn),2021 年數(shù)控機(jī)床市場(chǎng)規(guī)模恢復(fù)增長(zhǎng),達(dá) 2687 億元。中商產(chǎn)業(yè)研究院預(yù)測(cè),2022 年數(shù)控機(jī)床 產(chǎn)業(yè)規(guī)模將達(dá) 2957 億元。就目前形勢(shì)來(lái)看,我們認(rèn)為,一方面,隨著國(guó)內(nèi)疫情管控放開(kāi),經(jīng)濟(jì)環(huán)境向好,各 行各業(yè)活力加速恢復(fù),數(shù)控機(jī)床產(chǎn)業(yè)有望受益于下游需求加速擴(kuò)張;另一方面,隨著上 游核心零部件國(guó)產(chǎn)化水平提升,數(shù)控化率也會(huì)逐步提升,國(guó)產(chǎn)替代空間廣闊,因此,高 端數(shù)控機(jī)床產(chǎn)業(yè)勢(shì)在必行。
2) 智能工廠是實(shí)現(xiàn)智能制造的載體,協(xié)作機(jī)器人與智能倉(cāng)儲(chǔ)物流 是工廠新星
協(xié)作機(jī)器人
協(xié)作機(jī)器人是一種新型的工業(yè)機(jī)器人,掃除了人機(jī)協(xié)作的障礙,機(jī)器人與人可以在 生產(chǎn)線上協(xié)同作戰(zhàn),充分發(fā)揮機(jī)器人的效率及人類的智能,給未來(lái)工廠的工業(yè)生產(chǎn)和制 造帶來(lái)了根本性的變革。與傳統(tǒng)工業(yè)機(jī)器人有所區(qū)別,協(xié)作機(jī)器人優(yōu)勢(shì)特點(diǎn)明顯。與傳統(tǒng)工業(yè)機(jī)器人相比, 其不同之處在于:1)目標(biāo)市場(chǎng)不同,協(xié)作機(jī)器人偏向于應(yīng)用在中小企業(yè)及適應(yīng)柔性化生 產(chǎn)要求的企業(yè),而傳統(tǒng)工業(yè)機(jī)器人適用于大規(guī)模生產(chǎn)企業(yè)。2)模式不同,傳統(tǒng)工業(yè)機(jī)器人是作為整個(gè)生產(chǎn)線的組成部分,如果某個(gè)環(huán)節(jié)機(jī)器人壞了,整條產(chǎn)線可能會(huì)面臨停工 的風(fēng)險(xiǎn),而協(xié)作機(jī)器人更具備柔性特點(diǎn),代替的是人,使得整個(gè)生產(chǎn)流程更為靈活。優(yōu) 勢(shì)方面,協(xié)作機(jī)器人具備輕量化、友好性、人機(jī)協(xié)作、編程方便及感知能力五大特點(diǎn)。
圖片
智能倉(cāng)儲(chǔ)物流
智能倉(cāng)儲(chǔ)物流系統(tǒng)是通過(guò)信息化、物聯(lián)網(wǎng)和機(jī)電一體化共同實(shí)現(xiàn)的智慧物流解決方 案,通過(guò)將物料出入庫(kù)、存儲(chǔ)、輸送、生產(chǎn)、分揀等物流過(guò)程自動(dòng)化、信息化和智能化, 來(lái)實(shí)現(xiàn)降本增效的目的。從構(gòu)成來(lái)看,智能倉(cāng)儲(chǔ)物流系統(tǒng)包括硬件裝備和軟件系統(tǒng)。其中,硬件裝備可按環(huán)節(jié)分為倉(cāng)儲(chǔ)裝備、分揀裝備和搬運(yùn)與輸送裝備,具體的產(chǎn)品包括立 體倉(cāng)庫(kù)、堆垛機(jī)、穿梭車、輸送機(jī)、AGV、碼垛機(jī)器人和分揀機(jī)等,主要執(zhí)行具體的倉(cāng) 儲(chǔ)物流操作任務(wù);軟件系統(tǒng)是智能倉(cāng)儲(chǔ)物流系統(tǒng)的控制中心,主要包括倉(cāng)儲(chǔ)管理系統(tǒng) WMS 和倉(cāng)儲(chǔ)控制系統(tǒng) WCS,負(fù)責(zé)具體的倉(cāng)儲(chǔ)物流信息控制。從環(huán)節(jié)劃分,倉(cāng)儲(chǔ)裝備與 軟件系統(tǒng)的結(jié)合即智能倉(cāng)儲(chǔ);分揀與輸送、搬運(yùn)裝備與軟件系統(tǒng)的結(jié)合稱為狹義的智能 物流;若智能倉(cāng)儲(chǔ)物流系統(tǒng)與生產(chǎn)線對(duì)接,增加物料管理、產(chǎn)線對(duì)接等產(chǎn)線功能模塊, 即構(gòu)成智能產(chǎn)線倉(cāng)儲(chǔ)物流系統(tǒng),也就是常說(shuō)的智能產(chǎn)線,也是智能工廠的基礎(chǔ)版。
市場(chǎng)空間前景廣闊,黃金賽道有望開(kāi)啟高增。從智能倉(cāng)儲(chǔ)市場(chǎng)規(guī)模來(lái)看,根據(jù)頭豹 研究院統(tǒng)計(jì)的數(shù)據(jù)來(lái)看,受益于物流行業(yè)規(guī)模的迅速增長(zhǎng)和倉(cāng)儲(chǔ)環(huán)節(jié)降本增效的需求不 斷攀升,市場(chǎng)規(guī)模從2017年的712.5億元增至2021年的1145.5億元,CAGR達(dá)12.6%。但從設(shè)備滲透率中,也反映出智能倉(cāng)儲(chǔ)物流在很多領(lǐng)域的融合程度不足,因此向未來(lái)看, 隨著智能倉(cāng)儲(chǔ)物流與更多應(yīng)用場(chǎng)景融合和 5G、物聯(lián)網(wǎng)、人工智能等技術(shù)在倉(cāng)儲(chǔ)行業(yè)的進(jìn) 一步升級(jí),智能倉(cāng)儲(chǔ)行業(yè)有望加速發(fā)展,預(yù)計(jì) 2021-2026 年 CAGR 達(dá) 18.4%,2022 年 智能倉(cāng)儲(chǔ)物流市場(chǎng)規(guī)模約 1357 億,2026 年達(dá) 2665 億元。
6.3 AI 賦能工業(yè)互聯(lián)網(wǎng),打造高效率設(shè)備管理和生產(chǎn)流程
智能服務(wù)是智能制造的必然延伸,工業(yè)互聯(lián)網(wǎng)是制造業(yè)智能化的重要發(fā)展方向。工 業(yè)互聯(lián)網(wǎng)是數(shù)字化轉(zhuǎn)型的關(guān)鍵力量,更是推動(dòng)制造業(yè)轉(zhuǎn)型發(fā)展的重要支撐。工業(yè)互聯(lián)網(wǎng) 是全球工業(yè)系統(tǒng)與高級(jí)計(jì)算、分析、感應(yīng)技術(shù)以及互聯(lián)網(wǎng)連接融合的一種結(jié)果。其本質(zhì) 是通過(guò)開(kāi)放的、全球化的工業(yè)級(jí)網(wǎng)絡(luò)平臺(tái)把設(shè)備、生產(chǎn)線、工廠、供應(yīng)商、產(chǎn)品和客戶 緊密地連接和融合起來(lái),高效共享工業(yè)經(jīng)濟(jì)中的各種要素資源,從而通過(guò)自動(dòng)化、智能 化的生產(chǎn)方式降低成本、增加效率,幫助制造業(yè)延長(zhǎng)產(chǎn)業(yè)鏈,進(jìn)而推動(dòng)制造業(yè)轉(zhuǎn)型發(fā)展。換言之,工業(yè)互聯(lián)網(wǎng)是實(shí)現(xiàn)智能制造的發(fā)展模式和現(xiàn)實(shí)路徑。其產(chǎn)生背景也是國(guó)內(nèi)人口 紅利的消失,勞動(dòng)力成本上升。工業(yè)互聯(lián)網(wǎng)則通過(guò)信息技術(shù)與工業(yè)系統(tǒng)的深度融合,保 證對(duì)制造成本控制,因此,工業(yè)互聯(lián)網(wǎng)已成為主要工業(yè)國(guó)家搶占國(guó)際制造業(yè)競(jìng)爭(zhēng)的制高 點(diǎn)。
圖片
AI 算法的加入將有效提升設(shè)備運(yùn)行穩(wěn)定度和流程控制效率。以流程工業(yè) PHM 智能 監(jiān)測(cè)系統(tǒng)為例,傳統(tǒng)監(jiān)測(cè)方式需要大量人工進(jìn)行實(shí)時(shí)排障,隨著 AI 算法的加入,PHM 有望快速實(shí)現(xiàn)智能化、無(wú)人化,減少緊急維修事件發(fā)生的概率,降低其帶來(lái)的停機(jī)、排 障、維修損失,同時(shí)降低不必要的檢修次數(shù)和對(duì)應(yīng)成本。對(duì)于化工、冶金、煤炭等流程 行業(yè)來(lái)說(shuō),每一個(gè)泵、反應(yīng)釜、管路、溫控設(shè)備出現(xiàn)故障都會(huì)對(duì)產(chǎn)線造成重大影響,甚 至釀成生產(chǎn)事故。AI 帶來(lái)的能力提升將意義匪淺。
6.4 人工智能助力汽車智能化
1) 智能駕駛:從駕駛輔助到自動(dòng)駕駛
自動(dòng)駕駛汽車依靠人工智能、視覺(jué)計(jì)算、雷達(dá)、監(jiān)控裝置和全球定位系統(tǒng)協(xié)同合作, 它是一個(gè)集環(huán)境感知、規(guī)劃決策、多等級(jí)輔助駕駛等功能于一體的綜合系統(tǒng),它集中運(yùn) 用了計(jì)算機(jī)、現(xiàn)代傳感、信息融合、通訊、人工智能及自動(dòng)控制等技術(shù), 是典型的高新技 術(shù)綜合體。這種汽車擁有和人一樣的“思考”、“判斷”以及“行走”能力,使得電腦可以在沒(méi) 有任何人主動(dòng)的操作下,能夠自動(dòng)安全地操作機(jī)動(dòng)車輛。按照《汽車駕駛自動(dòng)化分級(jí)》,駕駛自動(dòng)化共分為:應(yīng)急輔助、部分駕駛輔助、組合 駕駛輔助、有條件自動(dòng)駕駛、高度自動(dòng)駕駛以及完全自動(dòng)駕駛六個(gè)層級(jí)。
智能駕駛的感知、處理和執(zhí)行都離不開(kāi)人工智能技術(shù)的基礎(chǔ)。首先,感知:讓車輛 配對(duì)相應(yīng)的感測(cè)器來(lái)收集車輛的行駛狀況和道路環(huán)境狀況等信息。不同的系統(tǒng)需要由不 同類型的車用感測(cè)器,包含毫米波雷達(dá)、超聲波雷達(dá)、紅外雷達(dá)、雷射雷達(dá)、CCD \CMOS 影像感測(cè)器及輪速感測(cè)器等來(lái)收集整車的工作狀態(tài)及其參數(shù)變化情形;其次,處理:將 感測(cè)器所搜集的信息進(jìn)行分析處理,再向智能控制中心傳達(dá)控制訊息;最后,執(zhí)行。根 據(jù)控制中心下達(dá)的命令,完成對(duì)汽車的駕駛。
2) 智能座艙:從出行工具到出行管家
智能座艙實(shí)質(zhì)是汽車駕駛艙中的人機(jī)交互場(chǎng)景,主要目的是將駕駛信息與娛樂(lè)信息 兩個(gè)模塊進(jìn)行集成,利用自身處理海量信息數(shù)據(jù)的強(qiáng)大能力,把握用戶在不同場(chǎng)景下的 行為習(xí)慣,并以此優(yōu)化智能座艙的空間結(jié)構(gòu),進(jìn)而提升用戶的駕乘體驗(yàn)。據(jù)《2022 中國(guó)智能汽車發(fā)展趨勢(shì)洞察報(bào)告》,未來(lái)隨著智能化技術(shù)的不斷普及,汽 車不再僅僅是交通工具,將擴(kuò)展成為日常生活的第三空間,用戶對(duì)乘坐體驗(yàn)要求更高, 智能座艙將加速普及。根據(jù) ICVTank 數(shù)據(jù),2022 年全球智能座艙行業(yè)市場(chǎng)規(guī)模有望達(dá) 461 億美元,中國(guó)作為全球最具發(fā)展?jié)摿Φ钠囀袌?chǎng),2019 年中國(guó)智能座艙市場(chǎng)規(guī)模達(dá) 441 億人民幣,預(yù)計(jì) 2025 年市場(chǎng)規(guī)模將達(dá) 1030 億人民幣,2017-2025 年的復(fù)合增長(zhǎng)率 為 13%,發(fā)展?jié)摿薮蟆?/span>
智能座艙是由不同的座艙電子組成的完整體系,其關(guān)鍵技術(shù)主要由四部分組成。第 一部分是機(jī)械技術(shù),包括可變化車體技術(shù)和內(nèi)飾機(jī)構(gòu)技術(shù)。未來(lái)汽車可根據(jù)不同模式進(jìn)行伸縮折疊是一種趨勢(shì),座艙需要可以根據(jù)乘客對(duì)于不同場(chǎng)景的使用需求,實(shí)現(xiàn)內(nèi)飾空 間的不斷調(diào)整變化。第二部分是電子硬件技術(shù),包含芯片技術(shù)、顯示屏技術(shù)、專用電器 總成以及傳感器技術(shù)四大技術(shù)。第三部分是軟件技術(shù),主要有操作系統(tǒng)和各種應(yīng)用軟件。汽車智能化發(fā)展必然會(huì)趨向于一機(jī)多屏,通過(guò)操作系統(tǒng)實(shí)現(xiàn)一個(gè)車機(jī)芯片控制各屏的軟 件。第四部分是兩大支撐技術(shù),分別是人工智能技術(shù)和云計(jì)算技術(shù)。未來(lái)智能算法的準(zhǔn) 確性決定了不同品牌智能座艙的差異化,是影響車內(nèi)體驗(yàn)的關(guān)鍵。
ChatGPT 加速落實(shí)“汽車機(jī)器人概念”。百度于 21 年 8 月舉辦的百度世界大會(huì) 2021 上首提“汽車機(jī)器人”的概念,并發(fā)布了具有跨時(shí)代意義的 Apollo“汽車機(jī)器人”。今年 2 月 15 日百度旗下智能汽車公司品牌集度計(jì)劃年內(nèi)推出“三體版”汽車機(jī)器人,將融合百度文 心一言的全面能力,打造針對(duì)智能汽車場(chǎng)景的大模型人工智能交互體驗(yàn),支持汽車機(jī)器 人實(shí)現(xiàn)自然交流的再進(jìn)階。近日,長(zhǎng)安汽車旗下深藍(lán)品牌公眾號(hào)發(fā)布題為“假如把 ChatGPT 裝進(jìn)長(zhǎng)安深藍(lán) SL03”的文章,內(nèi)容為 ChatGPT 與長(zhǎng)安深藍(lán) SL03 車機(jī)系統(tǒng) DEEPAL OS 的一番對(duì)話。通過(guò)這次對(duì)話,DEEPAL OS 將自身特點(diǎn)、優(yōu)勢(shì)逐一說(shuō)給 ChatGPT 的同時(shí),亦把自己介紹給了消費(fèi)者和網(wǎng)友。