LLM OpenAI社動向
Articles
2023-03-09 OpenAI 言語モデルごとのエンコーディング一覧
エンコーディングというかトークナイザの話といった方が誤解が無さそう。
とりあえずほとんどの最新のやつはcl100k_baseを使っている。
2023-04-16 npakaさん : OpenAI APIのファインチューニングの学習データのガイドライン
いずれ必要になるかもしれないファインチューニングの知識
2023-04-23 tiktokenでトークンについて掘り下げた記事
1漢字(ユニコード)が2つのトークンに分割されているのは知らなかった
使われ方が似ている文字が近くの文字コードに来ているとは限らないから、これは少し斬新だなという感想
2023-04-25 ChatGPTのWeb版がオプトアウトをより簡易に提供
30日保存はAPIと同様なので注意。
不正使用を監視するために必要な場合に使われるとのこと。
また、ChatGPT Businessもアナウンスされているが、単純にデフォルトでオプトアウトという形らしい。
2023-04-26 OpenAI の Embeddings API はイケてるのか、定量的に調べてみる - Qiita
2つの類似度計算では教師有モデルのBERTやLUKEの方が良いらしいが、これらは全てのペアに対して都度計算が必要なのでEmbeddingsにもメリットがある
他のEmbeddingsと比較するという点では、PKSHAの SimCSEがより良い結果らしい。これは参考になる。
2023-04-26 OpenAIのブランドガイドラインが公開された
明記する必要のあることがいくつかありそう
マークについても言及がある
2023-05-12 OpenAIがWeb browsingとPluginsのbeta版をもうすぐロールアウト
来週中にすべてのPlusユーザーに展開される予定
2023-05-18 OpenAIのOrganization機能の利用方法をまとめ
端的に言うと、APIの利用料をまとめて請求できるようになる機能
WebのUIから利用するChatGPTのPlusアカウントの請求をまとめて行うことは現状できない
2023-06-14 OpenAI APIのFunction callingで関数が呼ばれる条件を確認してみた | DevelopersIO
descriptionだけでなく引数情報なども参照して決定している様子
2023-07-09 ChatGPTのCode Interpreterはどこまでできるのか
numpyのような有名なライブラリは利用できるが、すべてのライブラリを利用できるというわけではない。
Code Interpreterは外部のネットワークから隔離された環境でソースコードを実行するためWeb APIなどは呼び出せない。
内容を理解できるのはあくまでテキストのみ
大量のファイルやサイズの大きなでファイルは扱えない
実行環境は維持できない
Python以外は実行できない
Last updated