Closed maekawataiki closed 1 year ago
RAG においては Claude Instant でも十分要約と出典のリストが可能なためレイテンシとコストの低い Claude Instant のサポートもあると良い。
instant のほうが安い https://aws.amazon.com/jp/bedrock/pricing/?nc1=h_ls
low-latency との触れ込みがある
たしかに、 https://github.com/ysekiy/jp-rag-sample/blob/d32c6c034304f8c20933b6896ef51f60aef08[…]y/backend/api/fargate/src/langchain/app/chain/claude_bedrock.py
を変えて、defaultをinstantにしておくほうが良さそうですね。
https://github.com/aws-samples/jp-rag-sample/pull/16
dry-run&approve おねしゃす。
RAG においては Claude Instant でも十分要約と出典のリストが可能なためレイテンシとコストの低い Claude Instant のサポートもあると良い。