日产免费线路四保养服务_亚洲中文字幕不卡无码_亚洲爆乳www无码专区_97免费人妻视在线视频_日本爽快片18禁免费

189-8047-6739

全鏈數(shù)字化私域運(yùn)營服務(wù)

您當(dāng)前位置> 主頁 > 私域講堂 > 行業(yè)熱點(diǎn)

Open AI發(fā)布新一代大模型“o1”:會(huì)像人類一樣“花時(shí)間思考”

發(fā)表時(shí)間:2024-09-14 14:34:21

文章作者:小編

瀏覽次數(shù):

AI領(lǐng)域再一次迎來了重大突破!

北京時(shí)間今日凌晨,OpenAI正式發(fā)布名為OpenAI o1的新模型,即之前所傳的“草莓”(Strawberry)模型,該模型可以執(zhí)行一些類似人類的推理任務(wù),在回復(fù)用戶詢問前會(huì)“花更多時(shí)間思考”。

OpenAI的CEO薩姆·奧爾特曼(Sam Altman)稱其為“新范式的開始”?!皁1”新一代大模型能夠解決多步驟問題,在復(fù)雜推理、數(shù)學(xué)和編程問題方面,能夠像人類一樣思考解決問題的過程。

相較于過往的大模型,OpenAI o1大模型的核心邏輯是通過學(xué)習(xí)大量數(shù)據(jù)集中的模式,進(jìn)而預(yù)測(cè)單詞生成的序列,嚴(yán)格意義上來講并未真正理解客戶提問。

Open AI此次發(fā)布的新一代大模型“o1”,可謂打破了我們對(duì)LLM固有水平的認(rèn)知。“對(duì)于復(fù)雜的推理任務(wù)而言,這是一個(gè)重大進(jìn)步,代表了人工智能能力的新水平,”O(jiān)pen AI表示。

Open AI發(fā)布新一代大模型“o1”:會(huì)像人類一樣“花時(shí)間思考”(圖1)

會(huì)像人類一樣“花時(shí)間思考”

Open AI發(fā)布的新一代大模型“o1”,在接收到用戶詢問后,在作出回答錢,會(huì)像人類一樣“花時(shí)間思考”,用時(shí)約10—20秒,進(jìn)而產(chǎn)生一個(gè)內(nèi)部思路鏈,從而嘗試不同的策略并識(shí)別自身的錯(cuò)誤。

因具備更為強(qiáng)大到推理能力,因而“o1”在多個(gè)行業(yè)具有更多應(yīng)用潛力,尤其是復(fù)雜的科學(xué)、數(shù)學(xué)和編程任務(wù)。

譬如,在處理物理、化學(xué)等問題時(shí),“o1”的表現(xiàn)甚至和該領(lǐng)域的博士生水平不相上下;

再譬如,在國際數(shù)學(xué)奧林匹克的資格考試中,“o1”的正確率為83%,能夠成功進(jìn)入美國前500名學(xué)生的行列,而GPT-4o模型的正確率僅為13%;在編程能力比賽Codeforces中,“o1”模型拿到89%百分位的成績,而GPT-4o只有11%。

Open AI發(fā)布新一代大模型“o1”:會(huì)像人類一樣“花時(shí)間思考”(圖2)

*對(duì)復(fù)雜數(shù)學(xué)問題的思路鏈

未來,該模型還有更多潛在的應(yīng)用場(chǎng)景,如醫(yī)療研究人員可利用該模型來標(biāo)注細(xì)胞測(cè)序數(shù)據(jù);物理學(xué)家可借助o1模型生成量子光學(xué)所需的復(fù)雜數(shù)學(xué)公式;軟件開發(fā)者則可借助它來構(gòu)建和執(zhí)行復(fù)雜的工作流程等。

可以看出,AI的能力越來越強(qiáng),可應(yīng)用的場(chǎng)景也越來越多。但是現(xiàn)階段,AI仍然有一定局限性,也無法應(yīng)用到一些非常具體的經(jīng)營管理場(chǎng)景或商業(yè)經(jīng)營場(chǎng)景里。我們可以期待AI的未來,但現(xiàn)階段,可能暫時(shí)還用不到AI工具,用的最多的仍是數(shù)字化系統(tǒng)工具,比如B2C商城系統(tǒng)、私域電商系統(tǒng)、小程序商城系統(tǒng)、分銷商城系統(tǒng)等等。

多享有數(shù)是一家專注于數(shù)字化服務(wù)、系統(tǒng)開發(fā)、新媒體營銷、農(nóng)村電商的專業(yè)互聯(lián)網(wǎng)公司,成立16年,助力5000+中小企業(yè)實(shí)現(xiàn)數(shù)字化轉(zhuǎn)型升級(jí)。成都B2C商城系統(tǒng)開發(fā),成都小程序商城系統(tǒng)開發(fā),就找多享有數(shù)!

缺點(diǎn)與局限

作為“o1”大模型的最初始版本,其也有著明顯的缺點(diǎn)與局限。

首先,其使用價(jià)格非常昂貴。

據(jù)悉,“o1”系列共包含三款模型:OpenAI o1、OpenAI o1-preview和OpenAI o1-mini。這兩款模型從今天開始對(duì)用戶開放使用:

  • OpenAI o1:高級(jí)推理模型,暫不對(duì)外開放;
  • OpenAI o1-preview:這個(gè)版本更注重深度推理處理,每周可使用30次;
  • OpenAI o1-mini:這個(gè)版本更高效、劃算,適用于編碼任務(wù),每周可以使用50次。

然而,OpenAI o1-preview版定價(jià)是每百萬個(gè)輸入tokens 15美元,每百萬個(gè)輸出tokens價(jià)格為60美元,分別是GPT-4o的3倍和4倍(一百萬tokens大致相當(dāng)于75萬個(gè)英文單詞)。

其次,該模型無法瀏覽實(shí)時(shí)網(wǎng)頁、無法上傳文件和圖片、缺乏廣泛的世界知識(shí)等。

目前,“o1”大模型只是一款“純文字版”,暫時(shí)無法瀏覽網(wǎng)頁信息以及上傳文件和圖片,這意味著它不具備ChatGPT的許多使用功能,在許多常見用例中不如GPT-4o那么強(qiáng)大,而且還有用量限制,o1-preview版每周上限為30條消息,o1-mini版每周上限為50條。

此外,“o1”大模型在很多領(lǐng)域的能力不如GPT-4o,譬如在關(guān)于世界的事實(shí)知識(shí)方面表現(xiàn)不佳;有的用例下推理能力較慢,需要更長的時(shí)間來回答問題;目前o1只是一個(gè)純文本模型,缺乏針對(duì)特定文檔進(jìn)行推理,或者從網(wǎng)絡(luò)收集實(shí)時(shí)信息的能力。

此外,讓AI模型玩井字棋(Tic-Tac-Toe)一直被認(rèn)為是個(gè)業(yè)界難題,擁有推理能力的“o1”大模型也還是會(huì)在這個(gè)游戲中出錯(cuò),無法完全攻克技術(shù)難關(guān)。


推薦文章