ChatGPT 是當今世界上知名度最高的聊天機器人之一。 作為一個一直在積極閱讀 SEO 和人工智能 (AI) 愛好者的推文的人,ChatGPT 是我每次打開 Twitter 時都會看到的一個名字。
什麼是聊天 GPT?
ChatGPT 是 Open.AI 利用機器學習技術構建的聊天機器人,被稱為“Generative Pre-trained Transformer 3 (GPT-3)”。 如果這是您第一次聽到它——GPT-3 是一種大型語言模型 (LLM)。 它使用機器學習來生成難以與人類書寫的文本區分開來的自然語言文本。
繁榮! 一個段落中有很多行話。
要記住的三個名字
術語“大型語言模型“,或 LLM,指的是一種機器學習模型,它在人類語言數據的大型數據集上進行訓練,能夠生成聽起來自然的文本。
生成式預訓練 Transformer 3,或 GPT-3,是一個特定的 LLM,由一家名為 OpenAI 的公司開發,在翻譯和文本摘要等廣泛的語言任務上取得了令人矚目的成果。
ChatGPT 是 GPT-3 語言模型的變體,專門設計用於在聊天機器人上下文中生成類似人類的文本。
所以,想想:
- LLM 作為幫助機器人讀寫人類語言的技術
- GPT-3 是一種由私人公司 (OpenAI) 開發的 LLM
- ChatGPT 是使用 GPT-3 在實時聊天中與人類互動的機器人
為什麼 ChatGPT 很特別?
ChatGPT 與其他語言模型(有很多!稍後會詳細介紹)的區別在於它能夠在對話的多個回合中保持上下文。 當您與機器人聊天時,它具有“記憶”並且可以生成與正在討論的主題相關的類似人類的響應,並且這些響應建立在用戶或聊天機器人本身先前所做的陳述之上。
但這還不是全部——該工具不僅可以進行對話,還可以做更多的事情。 它還能夠執行範圍廣泛的語言任務,例如翻譯、摘要、編碼(是的, 編程 語言也是人類語言),甚至寫詩。
ChatGPT 能為您做什麼?
從產生想法和內容到提供研究和支持——ChatGPT 是可以幫助個人和組織的寶貴資源 提高生產率 和效率。 無論您是業餘博客作者、律師、學校教師,甚至是公司 CEO – ChatGPT 都可以對您的工作產生重大影響。
以下是您可以外包給 ChatGPT 的一些具體任務。
對於博主
- 為您的下一篇博文產生想法並撰寫草稿
- 研究和核查博客內容
- 將內容(即評論、開發時間表)轉換為表格或項目符號列表
為律師
- 起草法律文件和合同
- 為非專業人士總結複雜的法律概念
- 組織和管理法律文件和案件檔案
對於學校教師
- 開發文件sson 計劃和教材
- 創建評估和測驗
- 為不同水平的學生生成不同的腳本
對於程序員
- 生成代碼片段和調試編碼錯誤
- 用書面語言解釋你的代碼
- 在不同編程語言之間切換功能
對於音樂家
- 生成歌曲創意和旋律
- 寫歌詞
- 研究並了解最新的行業趨勢和技術
對於公司首席執行官
- 組織和管理公司項目和任務
- 總結商業新聞、員工報告和演示文稿
- 與團隊成員和其他利益相關者協作(寫電子郵件、發短信等)
可用於 ChatGPT 的提示
我主要將 ChatGPT 用作我的教育者和寫作助手。 以下是我在工作中經常使用的一些提示。 Fatih Kadir Akın 在 提示.chat 而在 這本免費電子書 – 請務必查看是否需要更多。
I want you to act as an educational content creator. You will need to create engaging and informative lessons for students seeking guidance or advice in a particular topic.
I want you to act as a stand-up comedian. I will provide you with some statements and you will use your wit and creativity to create scripts based on those statements. You are allowed to incorporate personal anecdotes or experiences into the routine in order to make it more relatable and engaging for the audience.
This is the first statements:
Translate the following statements to English for me:
更深入地研究人類語言的機器學習
ChatGPT 並不孤單
雖然 GPT-3 功能強大且廣受歡迎,但市場上還有許多其他大型語言模型(見下表)。
大多數這些 LLM 都具有自己獨特的能力,並在各種語言任務上取得了很好的成績。 語言翻譯、情感分析和問答是 LLM 工具執行的一些常見語言工作。
市場上其他著名的法學碩士
型號 | 產品描述 | 尺寸 | 主要特點 |
---|---|---|---|
LLM | OpenAI開發的長格式語言模型 | 比 GPT-3 更小更簡單 | 專注於在特定領域或主題內生成連貫的文本 |
BERT | 谷歌開發的預訓練語言模型 | 中度 | 可以針對各種自然語言處理任務進行微調 |
XL網 | 由谷歌和卡內基梅隆大學開發的預訓練語言模型 | 大 | 使用一種稱為“排列語言建模”的新穎方法在廣泛的任務中取得出色的成績 |
羅伯塔 | Facebook AI 開發的預訓練語言模型 | 大 | 在更大的數據集上訓練的 BERT 變體,並對訓練過程進行了一些修改 |
ALBERT | 谷歌開發的預訓練語言模型 | 中度 | BERT 的輕量級版本,使用技術來減小尺寸和計算要求 |
艾莫 | 艾倫人工智能研究所開發的預訓練語言模型 | 大 | 使用能夠從周圍文本中捕獲含義的深層上下文化單詞表示 |
T5 | 谷歌開發的預訓練語言模型 | 大 | 無需特定任務培訓即可執行各種自然語言處理任務 |
CTRL | OpenAI 開發的預訓練語言模型 | 大 | 使用一種稱為“條件轉換器”的新穎方法來生成類似人類的文本 |
變形金剛 | 谷歌開發的預訓練語言模型 | 大 | 使用一種稱為“相對位置編碼”的新穎方法來模擬文本中的遠程依賴關係 |
法學碩士不懂
雖然像 ChatGPT 這樣的 LLM 非常擅長生成類似人類的文本, 他們對該主題沒有真正的理解、意見或信念 (* 見下面的旁注) 他們正在以與人相同的方式進行討論。
相反,LLM 能夠通過使用機器學習算法分析大量人類語言數據並學習數據中存在的模式和關係來生成文本。 一旦學習了這些模式,LLM 就會使用它們生成與訓練數據中的文本相似的新文本。
換句話說,法學碩士並不聰明。 他們只是非常擅長猜測在他們的“作品”中使用的正確詞語。
法學碩士(尤其是 ChatGPT)非常擅長猜測
法學碩士所做的是分析他們過去“閱讀”過的任何文本,並猜測接下來要寫的最佳單詞是什麼。
例如,為了確定下一個單詞來完成像“Wayne Rooney has dribbled pass...”這樣的句子,ChatGPT,我目前使用的 LLM,會分析它所訓練的語言數據中的模式和關係,以確定單詞和在這種情況下最有可能出現的短語。
該模型可能已經從其訓練數據中了解到,“過去”、“周圍”或“通過”等詞通常用於短語“運球傳球”之後。 然後它可以使用此信息生成一個新句子,內容如下:
- “韋恩·魯尼運球過掉了防守者”,或者
- “韋恩魯尼繞過防守隊員”,或者
- “韋恩·魯尼運球突破了防守者。”
句子只是單詞串
這是進一步展示 ChatGPT 預測功能的另一個示例。 以下片段摘自 珀西·傑克遜與閃電竊賊(第 1 冊)第一章 作者 Rick Riordan(我兒子最喜歡的小說)。
"Being a half-blood is dangerous. It's scary. Most of the time, it gets you killed in painful, nasty ways."
我要求 ChatGPT 完成該段落。 這是 ChatGPT 給我的兩個變體:
版本#1
"But I've always known that I was different. I've always known that I was a target. That's why I've trained myself to be strong. That's why I've learned how to defend myself. I won't let anyone hurt me. I won't let anyone take away the person I am."
版本#2
"I've tried to stay hidden, to keep a low profile. But it's not easy. There are always people watching, waiting for me to slip up. I can't let them catch me. I can't let them hurt me or my family."
在這兩個例子中,接下來的三句話繼續探討混血的主題以及隨之而來的危險和挑戰。
第一個選項側重於敘述者自己的堅強和自衛的努力,而第二個選項側重於敘述者隱藏和避免被發現的努力。 這兩種選擇都建立在混血是危險的並且可能導致傷害的想法之上,但是他們從不同的角度和基調來探討這個主題。
令人印象深刻,對吧?
法學碩士的缺點和問題
與任何機器學習模型一樣,ChatGPT 並不光鮮亮麗。 以下是 ChatGPT 可能出現的一些問題示例:
1.訓練數據的偏差
與大多數機器學習模型一樣,ChatGPT 在大型數據集上進行訓練。 它可能包含數據中存在的偏差。 猴子看,猴子做。 如果訓練數據包含由特定人群編寫的示例數量不成比例,ChatGPT 可能會生成偏向該人群的文本。
閱讀梅麗莎的文章 病毒式人工智能化身應用程序 Lensa 在未經我同意的情況下脫了我的衣服. 與 ChatGPT 無關,但它演示了 AI 可能出現的問題
2.難以理解上下文
ChatGPT 旨在根據輸入文本的上下文和含義生成響應。 但是,它有時可能難以理解特定提示或對話的上下文,這可能導致不准確或無意義的響應。
3.處理開放式任務的能力有限
ChatGPT 旨在生成對特定提示或問題的響應。 它可能難以處理開放式任務或未明確定義所需響應的情況。
4.處理不常見或特定領域語言的能力有限
ChatGPT 針對范圍廣泛的文本進行了訓練,但它可能難以理解或生成不常見或特定領域的語言。 如果您將 ChatGPT 用於需要深入了解特定領域或主題的任務,這可能會成為一個問題。
總的來說,ChatGPT 是一個強大而有用的工具,但它並非沒有局限性。 在使用 ChatGPT 時牢記這些限制並仔細考慮模型對特定任務的適用性非常重要。
總結
也許 ChatGPT 風靡全球的最大原因是因為它的簡單性。 不要相信我的話—— 您可以在這裡免費試用. 您不必成為技術嚮導 - 只需輸入幾句話,看看它是否發揮其魔力。 在將它發送給你的老闆、你的祖母或總統之前,一定要仔細檢查它的輸出。
和往常一樣,請記住:強大的語言建模能力伴隨著巨大的責任(希望在此過程中有一些笑聲)。
其他注意事項
GPT-3的發展
GPT-3的發展可以追溯到最初的研究論文《通過生成式預訓練提高語言理解”,由 Alec Radford 及其同事撰寫,並於 2018 年 XNUMX 月在 OpenAI 網站上以預印本形式發布。
2019 年 2 月,OpenAI 發布了 GPT-2,這是對原始 GPT 模型的重大改進。 GPT-8 在超過 1.5 億個網頁的數據集上進行了訓練,並且具有更大的尺寸(XNUMX 萬億個參數)。
2020 年 3 月,OpenAI 發布了 GPT-3,它是 GPT 模型的更大、更強大的版本。 GPT-175 在數十億網頁的數據集上進行訓練,參數大小為 XNUMX 億,使其成為有史以來最大的語言模型之一。 它能夠執行廣泛的語言任務,包括翻譯、摘要和問答,並且能夠生成類似人類的文本 難以與人寫的文字區分開來.
關於 Open.AI 公司
OpenAI 是一個位於加利福尼亞州舊金山的研究實驗室。 該公司致力於以負責任和安全的方式推進人工智能。 它成立於 2015 年,由科技行業知名人士資助,包括 Microsoft微軟, 伊隆麝香和 彼得·泰爾.
公司著名的領導人包括:
- 山姆·奧特曼 – OpenAI 的首席執行官和知名的科技行業領導者。 自公司成立以來,他一直參與其中,並在公司的成長和發展中發揮了關鍵作用(在這裡閱讀他的博客).
- 格雷格布羅克曼 – OpenAI 聯合創始人兼 CTO,前 CTO Stripe..他在公司大型語言模型的開發中發揮了關鍵作用,包括GPT-3(了解更多).
- 伊利亞·薩茨克維爾(Ilya Sutskever) – OpenAI 的首席科學家和公司的聯合創始人。 他是機器學習領域的領先專家,在公司研發工作的發展中發揮了關鍵作用(在這裡閱讀他的推文).
- 沃伊切赫·扎倫巴 – OpenAI 的聯合創始人兼研究科學家,在公司大型語言模型的開發中發揮了關鍵作用,包括 GPT-3(Twitter個人資料).
- 約翰舒爾曼 – OpenAI 的研究科學家,在公司強化學習算法和技術的開發中發揮了關鍵作用(Twitter個人資料).