當(dāng)前位置：首頁(yè) > 新聞資訊 > 機(jī)器人知識(shí) > OpenAI發(fā)布了有史以來(lái)強(qiáng)的NLP預(yù)訓(xùn)練模型GPT-3

OpenAI發(fā)布了有史以來(lái)強(qiáng)的NLP預(yù)訓(xùn)練模型GPT-3

來(lái)源：AI MOOC人工智能平臺(tái) 編輯：創(chuàng)澤時(shí)間：2020/6/9 主題：其他 [加盟]

2020年5月底OpenAI發(fā)布了有史以來(lái)強(qiáng)的NLP預(yù)訓(xùn)練模型GPT-3，大的GPT-3模型參數(shù)達(dá)到了1750億個(gè)參數(shù)。論文《Language Models are Few-Shot Learners》長(zhǎng)達(dá)74頁(yè)已發(fā)布在arXiv。

有網(wǎng)友估算大的GPT-3模型大小大約有700G，這個(gè)大小即使OpenAI公開(kāi)模型，我們一般的電腦也無(wú)法使用。一般需要使用分布式集群才能把這個(gè)模型跑起來(lái)。雖然OpenAI沒(méi)有公布論文的花費(fèi)，不過(guò)有網(wǎng)友估計(jì)這篇論文大約花費(fèi)了上千萬(wàn)美元用于模型訓(xùn)練。

如此驚人的模型在模型的設(shè)計(jì)上和訓(xùn)練上有什么特別之處嗎？答案是沒(méi)有。作者表示GPT-3的模型架構(gòu)跟GPT-2是一樣的，只是使用了更多的模型參數(shù)。模型訓(xùn)練也跟GPT-2是一樣的，使用預(yù)測(cè)下一個(gè)詞的方式來(lái)訓(xùn)練語(yǔ)言模型，只不過(guò)GPT-3訓(xùn)練時(shí)使用了更多的數(shù)據(jù)。

既然這樣，那這只怪獸特別之處是什么？GPT-3論文的核心在于下圖：

免费一级片观看,日韩99在线,欧美另类视频,第四色播日韩第一页

OpenAI發(fā)布了有史以來(lái)強(qiáng)的NLP預(yù)訓(xùn)練模型GPT-3

達(dá)摩院金榕教授113頁(yè)P(yáng)PT詳解達(dá)摩院在NLP、語(yǔ)音和CV上的進(jìn)展與應(yīng)用實(shí)踐

重構(gòu)ncnn，騰訊優(yōu)圖開(kāi)源新一代移動(dòng)端推理框架TNN

知識(shí)圖譜在個(gè)性化推薦L域的研究進(jìn)展及應(yīng)用

基于網(wǎng)格圖特征的琵琶指法自動(dòng)識(shí)別

利用時(shí)序信息提升遮擋行人檢測(cè)準(zhǔn)確度

京東姚霆：推理能力，正是多模態(tài)技術(shù)未來(lái)亟需突破的瓶頸

看G清視頻，如何做到不卡頓

基于真實(shí)環(huán)境數(shù)據(jù)集的機(jī)器人操作仿真基準(zhǔn)測(cè)試

億級(jí)視頻內(nèi)容如何實(shí)時(shí)更新

深度解析大規(guī)模參數(shù)語(yǔ)言模型Megatron-BERT

自然語(yǔ)言處理技術(shù)五大技術(shù)進(jìn)展和四大應(yīng)用與產(chǎn)品

自然語(yǔ)言處理技術(shù)發(fā)展趨勢(shì)進(jìn)一步推動(dòng)人工智能從感知智能向認(rèn)知智能的演進(jìn)

服務(wù)機(jī)器人(迎賓、講解、導(dǎo)診...)

智能消毒機(jī)器人

機(jī)器人開(kāi)發(fā)平臺(tái)

OpenAI發(fā)布了有史以來(lái)強(qiáng)的NLP預(yù)訓(xùn)練模型GPT-3

服務(wù)機(jī)器人(迎賓、講解、導(dǎo)診...)

智能消毒機(jī)器人

機(jī)器人開(kāi)發(fā)平臺(tái)

服務(wù)機(jī)器人(迎賓、講解、導(dǎo)診...)