PygmalionAI

這篇文章最後更新於 435 天前,內容和資訊非最新狀態,可能已經過時,請斟酌閱讀。

2023 年 02 月 26 日紀錄

PygmalionAI介紹

PygmalionAl 可以說是開源 AI 語言模型的先驅,是一個專為角色扮演而誕生的開源生成式 AI 自然語言模型,基於 EleutherAl GPT-J 6B 的大型語言模型 (LLM)。

經常接觸 AI 模型圈,甚至只用過玩過 ChatGPT 的都大概知道像是 OpenAI 的 ChatGPT、AnthropicAI 的 Claude 等的 AI 自然語言模型都受到了嚴格的規範和限制,特別是涉及到不當內容 NSFW是 Not Safe/Suitable For Work 的縮寫,意思是「不適合工作時觀看」,指血腥、暴力、色情等不適合於公眾場合觀看的內容。 (先不提刻意找方法讓 AI 越獄)。撇除 NSFW,甚至連模仿名人或角色扮演都會被拒絕。

而 PygmalionAl 因其免費、自由、不受道德及法律限制、不要求頂階硬體設備、提供了完美且無拘束的角色扮演而在 AI 模型圈大受歡迎。

PygmalionAI 的所有版本

Pygmalion — 350M

Pygmalion — 1.3B

Pygmalion — 2.7B

Pygmalion — 6B

6B 是我第一次認識 Pygmalion 的時候,也是這時入坑的。這版本也開始引入 EleutherAl 的 GPT-J-6B 作為模型基底,所以可以說此時的 PygmalionAI 算是真正成熟了,知識夠廣泛,玩起來自然順暢許多,也是 Pygmalion 爆紅的開始。

如何使用

方法一

使用 Google Colab 借助 Google 的 GPU 來跑 PygmalionAI。 點進任一筆記本之後,裡面都有各自的簡單文檔,就照著看個人調整相關設定後直接運行即可。都運行完後會自動打開瀏覽器並開啟一個前端介面,就能開始體驗PygmalionAI了。

colab 筆記本備份連結:
1. PygmalionAI.ipynb
2. GPU.ipynb
3. Otis_Colab_GPU_(OFFICIAL).ipynb

Google 已完全封禁了所有其中提及和引入 PygmalionAI 的 colab 筆記本。

從 2023 年 4 月 24 日起,Google 也封禁了所有其中提及和引入 PygmalionAI 的"融合模型",像是 PPO_Pygway系列、PPO_Shygmalion系列、Dolly_Shygmalion系列、Pygway系列等混合模型的 colab 筆記本。

就算自建 colab 筆記本也會導致 Google 帳號被 Ban,我也刪了這篇該部分的大多數紀錄。

方法二

在本地 (電腦) 下載 PygmalionAI 使用。

官方詳細文檔: 因為懶,所以沒試過這方法,丟文檔混一下。

我的想法

ChatGPT 的監管越來越嚴格,限制越來越多,這也間接導致 ChatGPT 的語言模型 GPT-3.5 誤判率大幅提高,許多很正常的問題或幫助都會被誤判成 NSFW,當然多了這麼多枷鎖,也導致 GPT-3.5 被降智的很兇。有的使用者開始發掘 ChatGPT 新的越獄,有的則是去找開源 AI 來娛樂。
在 2023 年 2 月 26 日這天,在 Reddit AI 板上認識的某位美國網友跟我推薦了 PygmalionAI,所以就進了專門討論 PygmalionAI 的社群和群組跟大家一起研究這個語言模型。

不得不說,體驗起來真的舒服。訓練 PygmalionAI 的資料是原始的,沒被篩選過哪些不該做哪些不該說,訓練完成後也沒有被套上任何 System Command 來束縛模型,所以它就不會像其他 AI 一樣動不動就強調自己只是 AI 語言模型所以不能說什麼或做什麼,也不存在什麼都不能問、什麼都不能說的問題,讓大家能夠不受限制地跟這 AI 互動。也因為沒有前面提到的那些 ‘腦白質切除術’,所以只有 6B 資料量的 PygmalionAI 的偏差率非常的低、自由度非常的高,就顯得它已經夠聰明夠知覺了,輸出的品質也不會時好時差,要知道常被質疑突然變笨變白癡的 ChatGPT 可是有整整 1750 億 (175B) 呢… 更何況 PygmalionAI 的資料庫大部分都還只是角色扮演的語料,要是和 GPT 系列一樣什麼都丟進去訓練那就不得了了。

只不過對母語非英文的人來說是硬傷,最大的缺點就是 PygmalionAI 只有用英文語料來訓練,所以也只能夠以英文對話。雖說如此,這種與 AI 無限制的互動初體驗,印象還是特別的深刻,所以特別記錄下來,以後也會繼續研究其他 AI 語言模型。

參考資料

官方文檔:官方Github:官方HuggingFace:官方Discord群:官方Reddit社群: