您當(dāng)前位置> 主頁 > 私域講堂 > 行業(yè)熱點(diǎn)
發(fā)表時(shí)間:2024-09-14 14:34:21
文章作者:小編
瀏覽次數(shù):
AI領(lǐng)域再一次迎來了重大突破!
北京時(shí)間今日凌晨,OpenAI正式發(fā)布名為OpenAI o1的新模型,即之前所傳的“草莓”(Strawberry)模型,該模型可以執(zhí)行一些類似人類的推理任務(wù),在回復(fù)用戶詢問前會(huì)“花更多時(shí)間思考”。
OpenAI的CEO薩姆·奧爾特曼(Sam Altman)稱其為“新范式的開始”?!皁1”新一代大模型能夠解決多步驟問題,在復(fù)雜推理、數(shù)學(xué)和編程問題方面,能夠像人類一樣思考解決問題的過程。
相較于過往的大模型,OpenAI o1大模型的核心邏輯是通過學(xué)習(xí)大量數(shù)據(jù)集中的模式,進(jìn)而預(yù)測(cè)單詞生成的序列,嚴(yán)格意義上來講并未真正理解客戶提問。
Open AI此次發(fā)布的新一代大模型“o1”,可謂打破了我們對(duì)LLM固有水平的認(rèn)知。“對(duì)于復(fù)雜的推理任務(wù)而言,這是一個(gè)重大進(jìn)步,代表了人工智能能力的新水平,”O(jiān)pen AI表示。
會(huì)像人類一樣“花時(shí)間思考”
Open AI發(fā)布的新一代大模型“o1”,在接收到用戶詢問后,在作出回答錢,會(huì)像人類一樣“花時(shí)間思考”,用時(shí)約10—20秒,進(jìn)而產(chǎn)生一個(gè)內(nèi)部思路鏈,從而嘗試不同的策略并識(shí)別自身的錯(cuò)誤。
因具備更為強(qiáng)大到推理能力,因而“o1”在多個(gè)行業(yè)具有更多應(yīng)用潛力,尤其是復(fù)雜的科學(xué)、數(shù)學(xué)和編程任務(wù)。
譬如,在處理物理、化學(xué)等問題時(shí),“o1”的表現(xiàn)甚至和該領(lǐng)域的博士生水平不相上下;
再譬如,在國際數(shù)學(xué)奧林匹克的資格考試中,“o1”的正確率為83%,能夠成功進(jìn)入美國前500名學(xué)生的行列,而GPT-4o模型的正確率僅為13%;在編程能力比賽Codeforces中,“o1”模型拿到89%百分位的成績,而GPT-4o只有11%。
*對(duì)復(fù)雜數(shù)學(xué)問題的思路鏈
未來,該模型還有更多潛在的應(yīng)用場(chǎng)景,如醫(yī)療研究人員可利用該模型來標(biāo)注細(xì)胞測(cè)序數(shù)據(jù);物理學(xué)家可借助o1模型生成量子光學(xué)所需的復(fù)雜數(shù)學(xué)公式;軟件開發(fā)者則可借助它來構(gòu)建和執(zhí)行復(fù)雜的工作流程等。
可以看出,AI的能力越來越強(qiáng),可應(yīng)用的場(chǎng)景也越來越多。但是現(xiàn)階段,AI仍然有一定局限性,也無法應(yīng)用到一些非常具體的經(jīng)營管理場(chǎng)景或商業(yè)經(jīng)營場(chǎng)景里。我們可以期待AI的未來,但現(xiàn)階段,可能暫時(shí)還用不到AI工具,用的最多的仍是數(shù)字化系統(tǒng)工具,比如B2C商城系統(tǒng)、私域電商系統(tǒng)、小程序商城系統(tǒng)、分銷商城系統(tǒng)等等。
多享有數(shù)是一家專注于數(shù)字化服務(wù)、系統(tǒng)開發(fā)、新媒體營銷、農(nóng)村電商的專業(yè)互聯(lián)網(wǎng)公司,成立16年,助力5000+中小企業(yè)實(shí)現(xiàn)數(shù)字化轉(zhuǎn)型升級(jí)。成都B2C商城系統(tǒng)開發(fā),成都小程序商城系統(tǒng)開發(fā),就找多享有數(shù)!
缺點(diǎn)與局限
作為“o1”大模型的最初始版本,其也有著明顯的缺點(diǎn)與局限。
首先,其使用價(jià)格非常昂貴。
據(jù)悉,“o1”系列共包含三款模型:OpenAI o1、OpenAI o1-preview和OpenAI o1-mini。這兩款模型從今天開始對(duì)用戶開放使用:
- OpenAI o1:高級(jí)推理模型,暫不對(duì)外開放;
- OpenAI o1-preview:這個(gè)版本更注重深度推理處理,每周可使用30次;
- OpenAI o1-mini:這個(gè)版本更高效、劃算,適用于編碼任務(wù),每周可以使用50次。
然而,OpenAI o1-preview版定價(jià)是每百萬個(gè)輸入tokens 15美元,每百萬個(gè)輸出tokens價(jià)格為60美元,分別是GPT-4o的3倍和4倍(一百萬tokens大致相當(dāng)于75萬個(gè)英文單詞)。
其次,該模型無法瀏覽實(shí)時(shí)網(wǎng)頁、無法上傳文件和圖片、缺乏廣泛的世界知識(shí)等。
目前,“o1”大模型只是一款“純文字版”,暫時(shí)無法瀏覽網(wǎng)頁信息以及上傳文件和圖片,這意味著它不具備ChatGPT的許多使用功能,在許多常見用例中不如GPT-4o那么強(qiáng)大,而且還有用量限制,o1-preview版每周上限為30條消息,o1-mini版每周上限為50條。
此外,“o1”大模型在很多領(lǐng)域的能力不如GPT-4o,譬如在關(guān)于世界的事實(shí)知識(shí)方面表現(xiàn)不佳;有的用例下推理能力較慢,需要更長的時(shí)間來回答問題;目前o1只是一個(gè)純文本模型,缺乏針對(duì)特定文檔進(jìn)行推理,或者從網(wǎng)絡(luò)收集實(shí)時(shí)信息的能力。
此外,讓AI模型玩井字棋(Tic-Tac-Toe)一直被認(rèn)為是個(gè)業(yè)界難題,擁有推理能力的“o1”大模型也還是會(huì)在這個(gè)游戲中出錯(cuò),無法完全攻克技術(shù)難關(guān)。
- 01-09淘寶推出「送禮物」功能:領(lǐng)取時(shí)限24小時(shí),春節(jié)「送禮大戰(zhàn)」愈演愈烈
- 01-06如何構(gòu)建數(shù)據(jù)產(chǎn)品:2025年數(shù)據(jù)行業(yè)開啟的新技能
- 01-02工信部:推動(dòng)“5G+工業(yè)互聯(lián)網(wǎng)”創(chuàng)新發(fā)展
- 12-31豆包定價(jià)一元的野心:字節(jié)跳動(dòng)打響AI突圍戰(zhàn)
- 12-27直播內(nèi)容卷出新高度,行業(yè)還有紅利嗎?
- 12-26十年一輪回,微信“送禮物”能否復(fù)制紅包奇跡?
- 12-26《2025全球消費(fèi)者趨勢(shì)》,消費(fèi)者更深思熟慮了
- 12-252024 AI大模型年度十大關(guān)鍵詞發(fā)布
- 12-25政企辦公應(yīng)用「鴻蒙化」勢(shì)頭正勁
- 12-242025年7個(gè)令人關(guān)注的數(shù)據(jù)治理趨勢(shì)
- 12-24從 OpenAI 12 天發(fā)布會(huì)里,我們看到了行業(yè)的四個(gè)關(guān)鍵問題
- 12-23互聯(lián)網(wǎng)入口不再屬于瀏覽器,未來是對(duì)話式AI的
- 12-23人工智能時(shí)代的數(shù)據(jù)戰(zhàn)略
- 12-20第三季度我國上市互聯(lián)網(wǎng)企業(yè)市值大漲 環(huán)比上升25.4%
- 12-20政策春風(fēng)助力零售業(yè),AI+SaaS引領(lǐng)數(shù)字化轉(zhuǎn)型與增長新機(jī)遇
- 12-19微信小店灰測(cè)“送禮物”功能
- 12-192024年十大科技進(jìn)步,除了AI還有這九個(gè)
- 12-18私域運(yùn)營深度解析:6大策略提升客戶生命周期價(jià)值
- 12-18為什么說AI落地營銷,才是真正的科技平權(quán)?