如今,人工智能的發(fā)展速度非???。我們周圍事物的復(fù)雜性不斷增長(zhǎng),這促使每個(gè)人都依賴人工智能,以多種方式幫助人類,從檢測(cè)欺詐交易、預(yù)測(cè)市場(chǎng)價(jià)格到在高層相關(guān)者中做出決策。在人工智能蓬勃發(fā)展與應(yīng)用的面前,任何企業(yè)都沒(méi)有理由不嘗試人工智能。基于2021年AI技術(shù)的發(fā)展,可以對(duì)人工智能在2022的發(fā)展進(jìn)行預(yù)測(cè)。
首先,我們對(duì) 2021 年AI發(fā)布的技術(shù)進(jìn)行簡(jiǎn)要整理。
2021 年 AI 技術(shù)
2021年 AI 主要的技術(shù)發(fā)布 在2 月份開(kāi)始,當(dāng)時(shí)谷歌發(fā)布了Tensorflow 3D,將深度學(xué)習(xí)模型升級(jí)到 3D 空間,實(shí)現(xiàn) 3D 場(chǎng)景理解,可用于虛擬現(xiàn)實(shí)、圖像中的點(diǎn)云應(yīng)用、激光雷達(dá)和自我視覺(jué)-自動(dòng)駕駛汽車。的自我監(jiān)督學(xué)習(xí),它能夠完成識(shí)別文本、圖像和其他主要在社交媒體中可用的非結(jié)構(gòu)化數(shù)據(jù)的無(wú)監(jiān)督任務(wù)。SEER 建立在 ImageNet 之上,該 ImageNet 對(duì)十億個(gè)隨機(jī)、未標(biāo)記和未策劃的公共 Instagram 圖像進(jìn)行了預(yù)訓(xùn)練。4月份沒(méi)有什么新鮮事,但是,歐盟提出了新的人工智能法規(guī),為該地區(qū)的人工智能橫向提供法律框架。擬議的法律框架側(cè)重于人工智能系統(tǒng)的具體利用和相關(guān)風(fēng)險(xiǎn)。
5 月,谷歌發(fā)布了 Vertex AI,它與谷歌云服務(wù)集成,可以使用基于視覺(jué)、視頻、自然語(yǔ)言等預(yù)訓(xùn)練 API的自動(dòng)化 ML (或 AutoML)的強(qiáng)大功能構(gòu)建 ML。使用 Vertex,通過(guò)簡(jiǎn)化編碼(低代碼開(kāi)發(fā))消除了運(yùn)行 ML 管道的復(fù)雜性。然后在 6 月,微軟的 GitHub 發(fā)布了他們的GitHub Copilot,它使用戶能夠通過(guò)自動(dòng)完成來(lái)加速編碼。自動(dòng)完成是,在有人完成他們的代碼之前,GitHub Copilot 將自行完成代碼。7 月,谷歌的DeepMind 發(fā)布了超過(guò) 350,000 種蛋白質(zhì)的預(yù)測(cè)形狀使用他們一年前開(kāi)發(fā)的 AlphaFold AI 系統(tǒng)。一些人聲稱,該數(shù)據(jù)庫(kù)可以在許多方面發(fā)生革命性變化,例如提高了解疾病和開(kāi)發(fā)新藥的能力。
8 月,來(lái)自卡內(nèi)基梅隆大學(xué)和麻省理工學(xué)院的研究人員發(fā)表了一項(xiàng)開(kāi)創(chuàng)性的發(fā)明,即一種新型的生成對(duì)抗網(wǎng)絡(luò) (GAN),它只能通過(guò)繪制草圖來(lái)生成模仿圖像,他們稱之為 GAN 草圖。然后在 10 月,NVIDIA 結(jié)合了兩個(gè)強(qiáng)大的語(yǔ)言轉(zhuǎn)換器,創(chuàng)建了超越 OpenAI 強(qiáng)大的 GPT-3的Megatron-Turing 自然語(yǔ)言生成(NLG)。該 Transformer 模型旨在通過(guò)GPU 加速基于數(shù)千億自然語(yǔ)言標(biāo)記將訓(xùn)練效率提高 10 倍。11 月,NVIDIA 再次發(fā)布了名為StyleGAN3的下一代 GAN ,它可以生成模仿人類照片幾乎 99.9% 逼真。最后,在 12 月,DeepMind 發(fā)布了另一個(gè)名為Gopher的自然語(yǔ)言轉(zhuǎn)換器模型,可以在人機(jī)交互中合成響應(yīng)。
基于這些突破,2022 年人工智能最有可能的五大預(yù)測(cè)如下。
預(yù)測(cè) 1:人工智能將在業(yè)務(wù)中更易于解釋和自動(dòng)化
Enthought 的首席運(yùn)營(yíng)官 Mike Connel 表示,超過(guò) 90% 的工業(yè) AI 或 ML 項(xiàng)目可能無(wú)法在 2022 年實(shí)現(xiàn)其業(yè)務(wù)目標(biāo),因?yàn)闊o(wú)法解釋他們?cè)跇I(yè)務(wù)中的模型??山忉尩?AI(或 XAI)變得如此重要,因?yàn)樗鼘?duì)許多企業(yè)構(gòu)成了威脅,例如,產(chǎn)生有偏見(jiàn)的結(jié)果的模型。業(yè)務(wù)的高級(jí)利益相關(guān)者將關(guān)注模型如何代表真實(shí)業(yè)務(wù)問(wèn)題的問(wèn)題,而不是如何對(duì)其進(jìn)行編碼。此外,企業(yè)對(duì)低代碼 ML 模型開(kāi)發(fā)的需求變得如此不可避免,因?yàn)殚_(kāi)發(fā)一個(gè)模型可能是乏味和迭代的。近年來(lái),自動(dòng)化 ML(或 AutoML)發(fā)展得如此迅速。
目前,開(kāi)發(fā) XAI 和 AutoML 的公司很少。最受歡迎的公司之一是H2O.ai , Inc.。H2O.ai 將其服務(wù)命名為Driverless AI。這項(xiàng) AI 服務(wù)使數(shù)據(jù)科學(xué)家能夠更快地開(kāi)發(fā)機(jī)器學(xué)習(xí)模型,因?yàn)?AutoML 能夠自動(dòng)處理所有流程(從數(shù)據(jù)探索、模型選擇和評(píng)估),并使用可視化為業(yè)務(wù)利益相關(guān)者解釋模型。這避免了機(jī)器學(xué)習(xí)是“黑盒”模型的觀點(diǎn)。此外,谷歌還提供 XAI 作為他們今年 5 月初發(fā)布的 Vertex AI 云平臺(tái)的堆棧。因此,這將不可避免地推動(dòng)云中自動(dòng)化和可解釋的 ML 模型在來(lái)年更快的發(fā)展。
預(yù)測(cè) 2:3D 人工智能將徹底改變自動(dòng)駕駛汽車
自動(dòng)駕駛或自動(dòng)駕駛汽車是一種駕駛者很少或沒(méi)有控制的概念。這些汽車可能有傳感器,可以對(duì)周圍環(huán)境進(jìn)行視覺(jué)感知,還有一個(gè)系統(tǒng)可以消化這些感官信息,以使用所謂的計(jì)算機(jī)視覺(jué)來(lái)控制運(yùn)動(dòng)。如今,大多數(shù)自動(dòng)駕駛汽車,例如配備 HW2.5 自動(dòng)駕駛系統(tǒng)的特斯拉 Model X,都使用基于卷積神經(jīng)網(wǎng)絡(luò)算法的2D 對(duì)象檢測(cè),即 YOLO(You Only Look Once)。LiDAR 相機(jī)傳感儀器捕獲的周圍環(huán)境圖像僅將信息處理為 2D 對(duì)象(或無(wú)深度對(duì)象)。這可能會(huì)限制自動(dòng)駕駛汽車做出自主決策的能力。
最近,出現(xiàn)了從 2D 到 3D 單目場(chǎng)景理解的升級(jí)趨勢(shì)。被稱為 3D 邊界框估計(jì)算法的算法試圖處理這種運(yùn)動(dòng),例如 Deep3DBox、FQNet、Shift R-CNN 和級(jí)聯(lián)幾何約束。還有其他方法,例如 Pseudo-3D 方法。隨著2021 年Tensorflow 3D的出現(xiàn),以 3D方式學(xué)習(xí)周圍物體的自動(dòng)駕駛汽車的未來(lái)非常有前景。據(jù)福布斯報(bào)道,由于許多人使用 Tensorflow 進(jìn)行深度學(xué)習(xí),因此使用新的 3D 版本將非常容易。對(duì)其他應(yīng)用的影響以及歷史建筑的保護(hù)在增強(qiáng)現(xiàn)實(shí)空間中也將在不久的將來(lái)可見(jiàn)。
預(yù)測(cè) 3:生成對(duì)抗網(wǎng)絡(luò) (GAN) 將徹底改變?cè)O(shè)計(jì)制造商
毫無(wú)疑問(wèn),GAN 是人們?cè)谡務(wù)撝T如在 Deepfake 中生成看起來(lái)像某人的臉的人臉、使用文森特·梵高的繪畫(huà)風(fēng)格創(chuàng)作新繪畫(huà)或制作一瓶酒的逼真圖像時(shí)所尋找的東西。 . 近年來(lái),GAN 徹底改變了藝術(shù)工作室和電影制作行業(yè)。
在不久的將來(lái),GAN 將登陸制造企業(yè)。最近,GAN 具有從 3D 渲染對(duì)象中學(xué)習(xí)并生成 3D 對(duì)象的能力。在科學(xué)和技術(shù)術(shù)語(yǔ)中,這稱為計(jì)算機(jī)輔助設(shè)計(jì)(或 CAD)。例如,來(lái)自 MIT CSAIL 的一組研究人員表明,GAN 可以學(xué)習(xí)將 3D 家具對(duì)象與 IKEA 包含家具照片的大型數(shù)據(jù)集區(qū)分開(kāi)來(lái)。然后,GAN 生成識(shí)別圖像的 3D 渲染對(duì)象。這是一個(gè)巨大的突破,因?yàn)樵谟?jì)算機(jī)軟件上手動(dòng)進(jìn)行 CAD 是制造業(yè)中漫長(zhǎng)而昂貴的過(guò)程。
此外,汽車行業(yè)將發(fā)現(xiàn) GAN 在設(shè)計(jì)車輛及其零部件方面的更多應(yīng)用。Monolith AI是一家總部位于英國(guó)的初創(chuàng)公司,是極少數(shù)在產(chǎn)品設(shè)計(jì)優(yōu)化中嘗試使用 GAN 的公司之一。他們展示了如何將 GAN 應(yīng)用于拓?fù)鋬?yōu)化和無(wú)網(wǎng)格設(shè)計(jì)生成以產(chǎn)生新的汽車設(shè)計(jì)。該企業(yè)還實(shí)施 GAN 以生成無(wú)法通過(guò)3D 打印生產(chǎn)的組件的 3D 對(duì)象,并解決這些組件的計(jì)算流體動(dòng)力學(xué) (CFD) 模擬。
隨著 GAN 在制造業(yè)中的這些應(yīng)用,人工智能很可能在明年成為設(shè)計(jì)優(yōu)化和增材制造過(guò)程中的主流。
預(yù)測(cè) 4:Transformers 和認(rèn)知 AI 將徹底改變語(yǔ)言應(yīng)用
自然語(yǔ)言處理和生成 (NLG) 已經(jīng)改變了企業(yè)通過(guò)社交媒體上的推文了解客戶、找到正確的事實(shí)并從新聞中識(shí)別惡作劇以及通過(guò)聊天機(jī)器人與人類對(duì)話的方式。NLG 依賴于使用轉(zhuǎn)換器,這是一種深度學(xué)習(xí)結(jié)構(gòu),由編碼器和解碼器處理輸入(可以是任何形式的數(shù)據(jù))和生成輸出(以文本形式)組成。
兩種最流行的 NLG 模型是 BERT(來(lái)自 Transformers 的雙向編碼器表示)和 GPT(生成式預(yù)訓(xùn)練 Transformer)。谷歌在 2018 年發(fā)布的 BERT 有 3.4 億個(gè)參數(shù),而 OpenAI 的 GPT-3 被稱為最強(qiáng)大的轉(zhuǎn)換器,有 1750 億個(gè)參數(shù)。參數(shù)的數(shù)量呈指數(shù)增長(zhǎng)。似乎只看它的走勢(shì),變形金剛之間的競(jìng)爭(zhēng)是無(wú)止境的。那么,這對(duì)自然語(yǔ)言世代的未來(lái)意味著什么?
自然語(yǔ)言處理可以通過(guò)將文本分解成句子結(jié)構(gòu)(或句法分析)并分析單詞、語(yǔ)法和意義的關(guān)系(或語(yǔ)義分析)來(lái)分類好情緒和壞情緒。我們需要提供盡可能多的數(shù)據(jù),讓 NLP 能夠識(shí)別上下文。未來(lái),NLP 會(huì)“有意識(shí)”地從文本中理解更多,比如從作者的情感中尋找隱含的意義,從而做出認(rèn)知 AI。隨著變壓器中現(xiàn)在有數(shù)十億個(gè)參數(shù)可用,認(rèn)知人工智能的出現(xiàn)即將到來(lái)。
認(rèn)知人工智能將幫助企業(yè)在客戶在聊天機(jī)器人中進(jìn)行對(duì)話后,向客戶提供更個(gè)性化的反饋。最流行的對(duì)話框架是亞馬遜的 Alexa 和蘋(píng)果的 Siri。對(duì)話的上下文將不再是通用的,例如詢問(wèn)姓名或職業(yè)。上下文將非常多樣化和具體,例如醫(yī)療保健中的科學(xué)、人力資源或醫(yī)療處方。
最后但同樣重要的是,NLP 將與圖像處理相結(jié)合,例如處理面部表情、手勢(shì)和肢體語(yǔ)言,以了解兩個(gè)人之間對(duì)話中的情緒。然后,認(rèn)知 AI 將生成人工對(duì)話。這種受生物識(shí)別啟發(fā)的認(rèn)知人工智能將在不久的將來(lái)流行。
預(yù)測(cè) 5:元宇宙中的數(shù)字孿生將主導(dǎo)行業(yè)
數(shù)字孿生是實(shí)時(shí)顯示物理行為的對(duì)象或系統(tǒng)的虛擬表示。如今,許多行業(yè)都使用它來(lái)了解其產(chǎn)品的行為和缺陷,例如機(jī)械或建筑結(jié)構(gòu),并通過(guò)模擬改進(jìn)其物理模型。通用電氣和勞斯萊斯等公司是使用數(shù)字孿生改進(jìn)噴氣發(fā)動(dòng)機(jī)設(shè)計(jì)的前沿領(lǐng)先行業(yè)。
為了代表數(shù)字孿生版本的原型,該原型配備了許多傳感器,用于測(cè)量操作期間的不同物理行為??赡苡袛?shù)百個(gè)傳感器需要了解。憑借海量的訓(xùn)練數(shù)據(jù),人工智能可以了解每個(gè)傳感器測(cè)量的行為和意義的復(fù)雜性,因此可以通過(guò)預(yù)測(cè)性維護(hù)或提供來(lái)預(yù)測(cè)故障發(fā)生。
現(xiàn)在,公司正在開(kāi)發(fā)虛擬現(xiàn)實(shí)和增強(qiáng)現(xiàn)實(shí)(VR 和 AR)體驗(yàn),使人們能夠使用感官直接與現(xiàn)實(shí)空間中不存在的物體進(jìn)行交互。進(jìn)行 VR 和 AR 最常見(jiàn)的方式是通過(guò)有限的交互將體驗(yàn)“放在桌面上”?,F(xiàn)在,技術(shù)使人們能夠在真實(shí)空間中與物體無(wú)縫交互。人們可以通過(guò) VR 和 AR 與對(duì)象交互的空間稱為元界。在 Metaverse 中,人們可以實(shí)時(shí)交互。未來(lái),更多的公司將在元界中結(jié)合AI應(yīng)用開(kāi)發(fā)用戶體驗(yàn)。波音公司剛剛宣布,他們將在元宇宙中對(duì)其飛機(jī)進(jìn)行 3D 工程設(shè)計(jì)使用微軟名為 HoloLens 的 AR 和 VR 技術(shù)。將工程引入虛擬世界有一些好處,即降低了制造真實(shí)原型的成本,因?yàn)榻M件的成本和設(shè)計(jì)的可重復(fù)實(shí)驗(yàn)。在不久的將來(lái),城市規(guī)劃、環(huán)境建筑設(shè)計(jì)和防災(zāi)很有可能在元宇宙中進(jìn)行。
小結(jié)
五個(gè)關(guān)鍵預(yù)測(cè)是人工智能將在業(yè)務(wù)中更加自動(dòng)化和可解釋,3D 中的人工智能將徹底改變自動(dòng)駕駛汽車中的計(jì)算機(jī)視覺(jué),GAN 將通過(guò)優(yōu)化實(shí)現(xiàn)制造設(shè)計(jì),Transformers 將徹底改變自然語(yǔ)言生成和人工人類對(duì)話,數(shù)字孿生將在 Metaverse 元宇宙中進(jìn)行。
鑒于人工智能理論方面的創(chuàng)新速度和復(fù)雜技術(shù)支持的實(shí)際應(yīng)用的創(chuàng)新速度,人工智能將繼續(xù)推動(dòng)進(jìn)程并幫助人類完成各種復(fù)雜的任務(wù)。
免責(zé)申明:此文章轉(zhuǎn)載至網(wǎng)絡(luò)如有侵權(quán)請(qǐng)聯(lián)系第一時(shí)間刪除