LLM アルゴリズム
2021-09-08 GPT-2のパラメータについての解説記事
割ときちんと解説されていてよくわからずに使っている場合は読んでおいた方が良い
2022-12-06 ChatGPTはどのように学習を行なっているのか
ChatGPT限定の結構詳しい記事
2023-03-22 Sparks of Artificial General Intelligence: Early experiments with GPT-4
Microsoft ResearchによるGPT-4を調査した論文
150ページにも及ぶため読めていない
2023-04-24 大規模言語モデルのための強化学習|npaka|note
なぜ「強化学習」が「教師あり学習」よりも言語モデルの学習に適しているのか、考察した記事で面白い
2023-04-24 Scaling Transformer to 1M tokens and beyond with RMT
200万トークンの処理が可能にスケーリングするモデルについての論文
Recurrent Memory Transformerという昨年の論文に基づいている
絵だけみる感じたと階層的にやる感じなのかなー、比較的ロースペック(1080Ti)で実験しているので検証はし易そうだがコードがない
この動画で話題になっている
2023-04-26 Harnessing the Power of LLMs in Practice: A Survey on ChatGPT and Beyond
GitHubで必要な論文などの情報がまとめられている
正攻法で学術的なまとめで、LangChainやLlamaIndexなどについては特に言及がない
Last updated