Amazon SageMaker

Amazon SageMaker Serverless Inference

必要に応じてエンドポイントを立ち上げることが可能なサービス。

ただし、GPU対応していないため、今後はそこの対応が期待される。

Serverlessが最適化どうか判断するためのベンチマークについて、以下のブログで紹介されている。

Introducing the Amazon SageMaker Serverless Inference Benchmarking Toolkit | AWS Machine Learning Blog

Amazon SageMaker Clarify

機械学習モデルの解釈可能性を可視化するサービス。

SHAPなどを使って寄与度を算出することが可能となっている。

【速報】その予測は本当に正しいの？データの偏りを検出するサービス「Amazon SageMaker Clarify」登場！ #reinvent | DevelopersIO

Amazon SageMaker Automatic Model Tuning

「ランダム」、「ベイズ」、「ハイパーバンド」、「グリッドサーチ」が使用可能。

「グリッドサーチ」は2022-10発表。

Amazon SageMaker Automatic Model Tuning now supports grid search | AWS Machine Learning Blog

「ハイパーバンド」は良く知らなかったけど、Bandit-Basedなランダムサーチらしい。(2016年発表なので比較的新しいかも)

https://arxiv.org/abs/1603.06560

Amazon SageMaker Data Labeling

機械学習モデルのトレーニング向けのデータセットを作成するサービス。

料金としては、数千ドルから数万ドルが事例としてある様子。

Data Labeling の料金 - Amazon SageMaker Ground Truth - Amazon Web Services

Amazon SageMaker Ground Truth

自社のデータラベリングワークフローやワークフォースを柔軟に構築および管理する。

Amazon Mechanical Turk、サードパーティーベンダー、または独自のプライベートワークフォースを介して人間のアノテーターを使用するオプションを提供可能。

また、自動ラベル付けされた合成画像を生成することも可能。(2022-06にGA)

以下の記事の紹介によると、作成したデータセットはSageMaker以外にもRekognition Custom Labelsでもそのまま使用可能。

[Amazon SageMaker] Ground Truthで物体検出用のデータセットを作成してみました | DevelopersIO

Amazon SageMaker Ground Truth Plus

ラベリングアプリケーションを構築したり、ラベル付けのための労働力を自ら管理したりすることなく、質の高いトレーニングデータセットを作成することが可能。

データをアップロードするだけで、SageMaker Ground Truth Plus がお客様に代わってデータラベリングワークフローとワークフォースを作成および管理する。

re:invent2021で発表された。

Amazon SageMaker Data Wrangler

機械学習向けのデータ前処理用のサービス。

データソースとしては、S3やAthena、Redshiftなど。

AWS SDK for pandas(旧称：AWS Data Wrangler)とは別物のため注意。

Wrangler自体で課金というよりはStudioを立ち上げてたりジョブを実行する際に課金される様子。

いつどこで課金が発生してる？Amazon SageMakerの動きと料金体系をセットで考える | DevelopersIO

Articles

2022-04-14 【Amazon SageMaker】ネットワーク設計パターンをまとめてみた
2023-04-20 AWS-CDKを使い爆速で機械学習環境SageMakerStudioを構築する。with TypeScript - Qiita
2023-06-12 SageMakerのバッチ変換でPCAを実行してみた | DevelopersIO
- なゆゆのSageMakerのバッチ変換
2023-06-21 ユーザーごとに Amazon SageMaker Studio ノートブックの利用料金を把握する方法
- 単なるタグの話
2023-07-06 Amazon SageMaker Studio ノートブックのインスタンスタイプをユーザーごとに利用制限する方法 | DevelopersIO
- ドメインに紐づいたユーザー毎の実行ロールに対してDenyなポリシーをアタッチすることで実現している
2023-07-14 Amazon SageMaker ドメイン作成時に設定が必要な各パラメータを解説
- めっちゃ有用記事だ！

Articles(公式)

2023-04-21 バッチ処理のユースケースに対応したSageMaker Pipelineの例を紹介
2023-04-27 CustomOpsでTrainiumの機能を拡張する方法
- TrainiumやInferentiaは、Neuron SDKを通じてソフトウェアでCustomOpsをサポート
- GPSIMDエンジンを用いてハードウェアを加速させる
  - General Purpose Single Instruction Multiple Data engine
2023-05-02 SageMaker上のTriton推論サーバで動作するFILバックエンドの詳細
- Triton推論サーバがエンドポイントで使用
- FIL(Forest Inference Library)は各フレームワーク（XGBoost, LightGBM, cuML）の独自性をうまく吸収してくれそう
2023-05-02 独自のMLモデルをSageMaker Canvasに持ち込み、正確な予測を生成する方法
- 以下３つのアーキテクチャ事例を紹介している
  - SageMaker AutopilotとCanvas
  - SageMaker JumpStartとCanvas
  - SageMaker Model RegistryとCanvas
2023-05-02 SageMaker JumpStartの基盤モデルによるRetrieval Augmented Generationを用いたQA
- LLMsを用いたRAGによるテキスト生成では、LLMsに供給されるコンテキストの一部として特定の外部データを供給することで、ドメイン固有のテキスト出力を生成することが可能
- 以下２つの事例を取り上げている
  - LangChainライブラリとAmazon SageMakerのエンドポイントを使う方法
  - SageMakerのKNNアルゴリズムを使って、SageMakerのエンドポイントを使って大規模データの意味検索を行う方法
- LLMsはオープンソース（GPT-J-6B、Flan T5 UL2、BloomZ 7B1）を使っており、近年のに比べると軽量なものの事例
2023-05-03 SageMakerドメイン復旧についてのソリューション事例 (AWS)
2023-05-04 SageMaker JumpStartを使ってGenerative AIをAWSで始める方法 (AWS)
2023-05-09 SageMaker上のTriton推論サーバで動作するPythonバックエンドの紹介
- FILの記事に似ている。違いが良く分からん。
2023-05-09 SageMaker上のESMFold言語モデルによるタンパク質構造予測の高速化
- ESMFoldは、アミノ酸配列からタンパク質の構造を予測するために開発された、高精度な深層学習ベースの手法
- AlpaFold2などと異なり、ルックアップやMultiple Sequence Alignmentを必要とせず、外部データベースへの依存もない
- その代わりに大規模なタンパク質言語モデル（pLM）をバックボーンとして使用する
2023-05-10 SageMaker CanvasのML予測を使ってAmazon QuickSightで予測ダッシュボードを公開する事例
2023-05-10 GravitonでSageMakerの推論コストを削減する
- Graviton3ベースのEC2 c7gインスタンスを使ったSageMakerリアルタイム推論の例
- 比較対象として、16個のvCPUと32GiBのメモリのスペックで横並びに評価している
- Gravitonインスタンスにモデルをデプロイするには、AWS DLC(Deep Learning Container)を使用するか、ARMv8.2アーキテクチャに対応したコンテナを自身で用意すればよいとのこと
- 自身で用意するための公式ドキュメント
  - Building your own algorithm container — Amazon SageMaker Examples 1.0.0 documentation
2023-05-16 SageMaker JumpStartでGPT-NeoXT-Chat-Base-20Bという基盤モデルを提供開始
- 20Bなので性能は良さそうだが、日本語対応が微妙かもしれない。
2023-05-17 SageMaker JumpStartで大規模言語モデルによるサーバーレスな会議要約バックエンドを構築
- Flan-T5-XLを使う。日本語モデルに差し替えできれば有用かもしれない。
- Lambda + S3のバケツリレーでTranscribeとSageMaker Endpointを使う
- SageMaker Endpointのお値段が。。
2023-05-22 SageMaker JumpstartによるFLAN T5 XLのインストラクションファインチューニング
2023-05-23 AWS CDKを使用してAmazon SageMaker JumpStartから生成型AIモデルをデプロイする
- アプリにはECS + Fargateを使用し、Streamlitで構築する
- 画像生成とNLU・テキスト生成にはAPIGW + Lambda + SageMaker Endpointを使用
- これらすべてを4つのStackに分けてCDKで構築している
2023-05-24 SageMaker Jumpstart Text2Textでバッチ変換を実行する例
- こちらもFLAN T5を使用する例
2023-05-30 SageMakerの使用量を分析し、使用状況に応じたコスト最適化の機会を見極める(全五回シリーズ)
2023-05-30 SageMaker XGBoostが完全分散型GPUトレーニングを提供開始
- マルチGPUでのトレーニングに対応
2023-05-31 SageMakerで基盤モデルを使用して認定試験へ学習する
2023-05-31 SageMaker Python SDKでAmazon SageMakerリソースのデフォルトを設定・使用する
2023-05-31 SageMaker上でTritonのPyTorchバックエンドを深く理解する
2023-05-31 Amazon ECS でTrainiumインスタンスを使用してコンテナ内でMLワークロードを実行する
2023-06-07 SageMakerで最新のLLM基盤モデル Falcon-40Bをトレーニング
- 最近界隈で石油マネーLLMと話題になっているやつ
- 記事はゼロから事前学習モデルを作る方法について紹介されているのであくまで読み物として
2023-06-06 SageMaker Python SDKを使用して、Amazon SageMaker Offline Featurestoreから機械学習可能なデータセットを構築する
2023-06-09 Tritonを使用してAmazon SageMaker上でONNXモデルをホストする
- ONNXの最大のメリットは、異なるフレームワークやツール間でMLモデルを表現し、交換するための標準化された形式を提供すること
- 記事では、GPUを使用するマルチモデルエンドポイント（MME）向けにONNXベースのモデルをデプロイする方法を紹介
2023-06-12 SageMaker Hugging Face Estimatorとモデル並列ライブラリを使ってGPT-Jをfine tuningする
- モデル並列化に関する説明があってよい
2023-06-12 Amazon SageMaker上でOpenChatkitのモデルを使用したカスタムチャットボットアプリケーションを構築
2023-06-13 DLC上にFalcon-40BをAmazon SageMakerにデプロイする
2023-06-14 SageMakerプロジェクトを使用しSageMaker AutopilotをMLOpsプロセスに導入する方法
2023-06-21 AWS CDK を使用して、Amazon SageMaker Studio ライフサイクル構成をデプロイ
2023-06-22 日本語大規模言語モデル OpenCALM の知識でクイズ王に挑戦する | Amazon Web Services ブログ
- 少し考察が偏っており、個人的には7Bでは到底GPT-3.5-turboなどに及ばないことが分かる。
- もう少し大規模化しないとちょっと難しそう
2023-06-22 ライト＆ワンダーがAWSでゲーム機の予知保全ソリューションを構築した方法
- カジノの設備の予知保全ソリューションの構築例。
- ベースラインにAutoGluon、そしてSageMaker automatic model tuningでDeep Learningを使っている様子
- Deep Learningのアーキテクチャはお手製で結構きちんと頑張っている印象なので参考になる
2023-06-23 FastAPI、AWS Lambda、AWS CDKを使用した大規模言語モデルのサーバーレスML推論エンドポイントのデプロイ
2023-06-27 Earth.comとProvectusがAmazon SageMakerでMLOpsインフラを導入した方法
2023-06-27 Amazon SageMaker JumpStartの独自基盤モデルをAmazon SageMaker Studioで使用する
- SageMaker JumpStart には、2 種類の基礎モデルがある
- Proprietary models
  - AI21、Cohereなどが提供する事前学習済みモデルで、scriptsや重みなどのmodel artifactsは閲覧できない
- Publicly available models
  - HuggingFaceなどで公開されているFLANやFalconなどのモデル
2023-06-29 Amazon SageMaker Studio Notebook上でFalcon-40BなどのLLMをQLoRAでチューニングする方法
- 具体的には、単一のml.g5.12xlargeインスタンス（4 A10G GPU）を使用してFalcon-40Bを微調整する
2023-06-30 Amazon SageMaker Canvasを使用して製造品質のためのコンピュータビジョンによる欠陥検出の例
2023-07-03 AWS上のディープラーニングに基づく先進運転支援システムのための自動ラベリングモジュール
- Ground Truth の自動ラベリング機能の使い方を紹介
2023-07-05 SageMaker Jumpstartを使用した車両故障確率の予測
2023-07-11 SageMaker トレーニングワークロード用の @remote デコレーターを使用してプライベートリポジトリにアクセス
2023-07-18 Amazon SageMakerを使用したスパムメール検知器の構築
2023-07-19 自分のデータを使って要約と質問応答のための生成的AI基礎モデルを使用する
- LangChainでRAGを実現する複雑めなアーキテクチャ
2023-07-20 Amazon SageMakerを使用して、カスタムアンサンブルのトレーニング、チューニング、デプロイを効率化
2023-07-21 Amazon SageMakerの地理空間機能を使ってネズミの侵入を分析
2023-07-21 Amazon SageMaker ドメインのアクセス認証がAWS IAM Identity Centerの場合、ユーザー同士でファイル共有する方法2選 | DevelopersIO
2023-07-31 SageMaker Canvasの高度なメトリクスを深く掘り下げる
2023-07-31 SageMakerで創薬を加速するタンパク質フォールディングワークフローを構築
2023-08-01 SageMakerでカスタム要約モデルを構築する
- 基礎として使っているモデルは、Hugging Face Hubで提供されているGoogleのPegasus
- これをJumpStartでfine-tuningする
2023-08-02 ジェネレーティブAIとAmazon Kendraを使用して、企業規模で画像のキャプション作成と検索を自動化
2023-08-03 Amazon SageMakerとAmazon Rekognitionを使用して、画像内の車の位置を検出するコンピュータビジョンモデルの構築とトレーニング
- RekognitionモデルまたはカスタムDetectronモデルのいずれかを呼び出して車の位置を検出できるAmplifyのモックウェブアプリケーションで構成
2023-08-03 SageMaker Canvas がどのようにデータを処理し、モデルを訓練し、異なるデータセットサイズに対してより高速かつ効率的に予測を生成できるようになったかを紹介
2023-08-03 Amazon SageMakerで数千のMLモデルのトレーニングと推論をスケールアップ
2023-08-03 生成AIによるAWSインテリジェント文書処理の強化
- textractで抽出し、LLMで要約を作る事例
2023-08-04 SageMaker Data Wranglerの新機能でデータ準備を最適化
2023-08-04 SageMaker Data Wranglerの新機能でデータ準備を最適化
2023-08-07 大規模言語モデル（LLM）の微調整を行い、大手ゲーム会社の有害音声を分類
2023-08-08 SageMakerのマルチモデルエンドポイントをGPU上に配置する
2023-08-08 Amazon SageMaker Studio で Spark UI をホストする
2023-08-09 SageMakerに導入されたジェネレーティブAIを使ってクリエイティブな広告を生成する
- SAMを生成AIって言っている…？
2023-08-10 CloudWatchを使用したAmazon SageMakerの集中監視およびレポートソリューションの構築
2023-08-11 SageMaker JumpStartによるゼロショットテキスト分類

Updates

2023-04-19 SageMaker Studio LabがCAPTCHAに対応しボットやスクリプトの使用を抑制
- あの画像に記載された文字を手入力したりするやつ
2023-04-20 SageMaker Inference Recommenderの最新のアップデート
- SageMaker Python SDKによる推論リコメンダーの実行サポート
- 推論レコメンダーの操作性向上
- 推論リコメンダーの柔軟な運用を可能にする新APIを公開
- ロギングとメトリクスのためのAmazon CloudWatchとのより深い統合
2023-04-25 ローカルMLコードのリモートジョブへの変換を高速化
- SageMaker Python SDKを使って、作成したローカルMLコードを、依存関係とともに、最小限のコード変更でトレーニングジョブとして実行できるように
- コードにPythonデコレータを追加するだけで、そのコード、データセット、ワークスペース環境の設定を受け取り、SageMaker Trainingジョブとして実行
- サンプルノートブックはこちら
- 公式ブログはこちら
2023-04-27 SageMaker with TensorBoardの一般提供を開始
- TensorBoardを使用して、SageMakerトレーニングジョブのモデル収束の問題を可視化し、デバッグが可能に
- TensorBoardは、トレーニングセットと検証セットにおけるモデルの精度やロスを追跡するために一般的に使用される観測可能ツール
- 価格表にも更新があり、ホスティングするためにml.r5.largeインスタンスが使われ、US Eastで1時間$0.126程度
- 東京リージョンではまだ使えない。
- 公式ブログ
  - Amazon SageMaker with TensorBoard: An overview of a hosted TensorBoard experience | AWS Machine Learning Blog
2023-05-01 Data Wranglerが画像データ作成に対応
- ラベリング、トレーニング、推論のための画像データを準備することが可能に
- S3から画像をプレビューしてインポートし、さまざまな組み込み画像変換を使用して、画像データのクリーン化、標準化、品質改善を行う
- ビルトイン変換には、リサイズ、重複の削除、回転、反転、グレイスケール、コントラストの強化、ぼかし、ノイズの追加など
- スニペットを使って、異常値の検出や画像からテキストを抽出するなどの高度な使用例もサポート
- 公式ブログ
  - Prepare image data with Amazon SageMaker Data Wrangler | AWS Machine Learning Blog
2023-05-03 SageMakerのデプロイインスタンスにml.inf2とml.trn1が対応 (AWS)
- 公式ブログでも
  - 2023-05-04 SageMaker上でInferentia2とTrainiumを使ってGenerative AIの推論を低コスト・高パフォーマンスで実現する方法
2023-05-10 SageMaker Serverless Inferenceのプロビジョンドコンカレンシーを発表
- Serverless Inferenceのコールドスタートを緩和し、ワークロードの予測可能なパフォーマンス特性を得ることが可能に
Announcing provisioned concurrency for Amazon SageMaker Serverless Inference | AWS Machine Learning Blog
2023-05-10 SageMaker CanvasでMLモデルを本番で運用できるように
- 学習したモデルをワンクリックでSageMaker Model registryに登録できるように
- 公式ブログ
  - Operationalize ML models built in Amazon SageMaker Canvas to production using the Amazon SageMaker Model Registry | AWS Machine Learning Blog
2023-05-10 SageMakerノートブックがml.p4d、ml.p4de、ml.inf1インスタンスをサポート
- inf1はinf2が先行していた
2023-05-10 SageMaker Autopilotは、重みを持つMLモデルのトレーニングや、8つの目的指標をサポート
- Ensembleモードでの重み付き客観指標による訓練をサポート
- 追加目的指標は、RMSE、MAE、R2、Balanced Accuracy、Precision、Precision Macro、Recall、Recall Macro
- 標準的な指標がそろった感じか
- APIアップデートが先行していた
  - 2023-05-02 Sagemaker Autopilotは、サンプルの重みと追加の目的指標を持つトレーニングモデルをサポート (AWS)
2023-05-19 SageMaker Geospatial MLが一般提供開始
2023-05-25 SageMaker JumpStartがLLMのドメイン固有のデータセットによるfine-tuning機能を提供
- 公式ブログによる紹介はGPT-J 6Bモデル
  - Domain-adaptation Fine-tuning of Foundation Models in Amazon SageMaker JumpStart on Financial data | AWS Machine Learning Blog
2023-05-26 SageMaker Notebook インスタンスに ml.p4d と ml.infが追加
2023-05-30 SageMaker Ground Truth PlusがRLHF(Reinforcement Learning from Human Feedback)に対応
- RLHFにより人間の好みに合った出力を学習できる
- 公式ブログ
  - High-quality human feedback for your generative AI applications from Amazon SageMaker Ground Truth Plus | AWS Machine Learning Blog
2023-06-06 SageMaker Automatic Model Tuningが探索や試行、最大実行時間を目標変数に基づいた自動選択が可能に
- ジョブ定義の一部として必要だったハイパーパラメータの範囲、チューニング戦略、ジョブ数などの設定を指定する必要がない新しい設定であるautotuneを提供する
2023-06-07 SageMaker Pipelinesにおいて、パイプライン内の任意のステップをサブワークフローとして実行することができる新機能を発表
- 関連するAPI Changes
  - https://awsapichanges.info/archive/changes/372fd4-api.sagemaker.html
2023-06-07 SageMaker Canvasがモデルの再トレーニングと、更新されたデータセットによるバッチ予測ワークフローの自動化機能を提供
- プロダクション向きの機能がでてきた
- 対応するデータソースは、ローカルアップロードとAmazon S3のみ。
- 公式ブログ
2023-06-08 Amazon SageMaker DistributionがECRから利用可能に
- Amazon SageMaker Distributionは、機械学習、データサイエンス、可視化のための主要なフレームワークを含むDockerイメージのセット
- CPUとGPUの2種類を準備し、PyTorch、TensorFlow、KerasなどのDeep Learningフレームワーク、numpy、scikit-learn、pandasなどのPythonパッケージ、およびJupyter LabなどのIDEが含まれる
- GPU版は5.3GB程度のイメージサイズ
2023-06-09 Falcon 40B基盤モデルがSageMaker JumpStartで利用可能に
- Falcon 40Bは、Apache 2.0ライセンスで利用可能な400億パラメータの大規模言語モデル
- 以下のサンプルノートブックで試すことが可能
  - amazon-sagemaker-examples/introduction_to_amazon_algorithms/jumpstart-foundation-models/text-generation-falcon.ipynb
2023-06-21 SageMaker Feature Storeのfeature processingを使用してデータをMLの特徴量に変換する機能が発表
- データソースと、データに対して実行したい変換関数を提供するだけで、SageMaker Feature Store がデータを ML フィーチャに変換できる
2023-06-26 Amazon SageMaker Neo用のPyTorchおよびTensorFlowモデルをコンパイルするための追加ターゲットとして、inf2およびtrn1を選択可能に
2023-06-26 Amazon SageMaker Data WranglerはSnowflakeへの直接接続が可能に- 2023-06-26 Amazon SageMaker Role Manager、数分できめ細かな権限を作成できるCDKライブラリを提供開始
- 公式ブログ
2023-06-23 Amazon SageMaker推論レコメンダーがAWS Consoleに登場
2023-06-30 RStudio on Amazon SageMakerに開発者の生産性を向上させる新しい RStudio Workbench バージョン 2023.03 が追加
2023-06-30 Amazon SageMaker Feature StoreがオンラインストアのTTLをサポート
2023-06-30 Amazon SageMaker Canvasが Apache Parquet ファイル形式をサポート
2023-07-05 Amazon SageMaker Model Cards と Amazon SageMaker Model Registry の統合を発表
2023-07-18 Meta社のLlama 2ファンデーションモデルがAmazon SageMaker JumpStartに登場
- 公式ブログ
  - Llama 2 foundation models from Meta are now available in Amazon SageMaker JumpStart | AWS Machine Learning Blog
2023-07-19 Amazon SageMaker モデルカードとモデルレジストリの統合を発表
2023-07-20 SageMakerフィーチャーストアのクロスアカウントサポート
2023-07-25 Amazon SageMaker CanvasがML artifactsのS3出力先のカスタムが可能に
2023-07-25 Amazon SageMaker Canvasが新しい5つのデータ前処理機能を追加
- 列のデータ型を数値、テキスト、日時の間で変更することが可能となり、バイナリやカテゴリカルなどのデータ型に関する表示も可能に
- 時系列データを再サンプルして、時系列データセットの観測値を一定の間隔にすることが可能に
- データ内の行を管理する方法が改善され、昇順または降順に並べ替えたり、ランダムにシャッフルしたり、重複する行を削除したりできるように
2023-07-25 Amazon SageMaker CanvasでAmazon Textractによって提供されるすぐに使えるモデルであるDocument Queriesが使用可能に
- Document Queriesによりドキュメントの構造 (テーブル、フォーム、フィールド、ネストされたデータ) についての事前知識がなくても、自然言語を使用して構造化ドキュメントから抽出したいデータを指定できる
2023-07-25 Amazon SageMaker CanvasがAmazon QuickSightとの機械学習（ML）モデルの共有をサポート
- Canvasでモデルを構築し、QuickSightでダッシュボードを構築するための予測を生成できるように
- Canvasからモデルを共有すると、すべての入力データと出力データの属性からなるMLモデルのスキーマファイルが自動的に作成
2023-07-25 Amazon SageMaker Canvasが機械学習（ML）モデルを異なる客観的指標でトレーニングする機能を提供
- これまで SageMaker Canvas は、各問題タイプに対して単一のデフォルトの目的メトリックのみをサポートしていた
- 以降は、サポートされているメトリックのリストから目的メトリックを選択し、それに従って ML モデルを最適化することが可能
2023-08-02 SageMaker Studio、機械学習用のビルド済みドッカー「SageMaker Distribution」を発表
2023-08-04 Amazon SageMakerがSalesforce Data Cloudとの新たな直接統合を発表
- Amazon SageMakerとSalesforce Data Cloudを使用して独自のAIを導入する
- Amazon SageMakerとSalesforce Data Cloudの統合を利用して、AI/MLでSalesforceアプリを強化する

PreviousAmazon Personalize NextAmazon Kendra

Last updated 1 year ago