Open Akira-Isegawa opened 3 months ago
https://arxiv.org/pdf/1706.03762.pdf
The model largely follows the details of the OpenAI GPT model (Radford et al., 2018) with a few modifications. Layer normalization (Ba et al., 2016) was moved to the input of each sub-block, similar to a pre-activation residual network (He et al., 2016) and an additional layer normalization was added after the final selfattention block.
- Layer Normalizationの場所が変わった
- 次の記事の解説が詳しい https://zenn.dev/sunbluesome/articles/775ffd67fb7454
参考:LLM 大規模言語モデル講座 GPT3.5 以降の詳細はよくわからなかったので、上記の学習の仕方については松尾研究所が無償公開しているLLM 大規模言語モデル講座の内容を参考にした。
要約すると、下記の3つのサブモデルを内蔵したモデルによって、マルチモーダルを実現
参考: Googel Cloud ブログ マルチモーダル検索とは何か: 「視覚を持った LLM」でビジネスが変わる Stanford CS224N NLP with Deep Learning | 2023 | Lecture 16 - Multimodal Deep Learning, Douwe Kiela
主にシステムに組み込んで使っていく際の基礎知識をまとめる。
Prompt Engineering Guideが全般的に詳しい。以下ではそこからよく使う手法をピックアップして紹介する。
これらを設計パターンと言ってよいのかは分からないが、ソフトウェアと生成AIの組み合わせによって、単体では実現できない成果が出たことが報告されている。多くはLangChainに実装されており参考になる。(参考にはなるが、LangChainも急速に進化しているため、仕様が安定しておらず、最新について行くためのメンテナンスが大変な印象。)
各ベンチマークの特性を知っておけば、どのモデルが何に強いかを大まかに把握できる。また、カスタマイズした際の総合的な性能の評価などに用いることができる。
システムが提供するタスクの性能を維持・改善していくために、適切な評価指標を定めて、定期的に計測・調査を行う必要がある。
ソフトウェアエンジニアとして、生成AIとどう関わっていけばいいのか?
Tab
Alt+]
or Option+]
Control+→
or Command+→
TODO: レビューでの利用については、下記のケースでどれが一番性能がよいかを確認する必要がある
現状では、github copilotをプログラムから利用するAPIは公開されていないようなので、プログラムで繰り返し処理をしたい場合などは、OpenAIのAPIを利用するのがよいか。(language server経由で呼び出す方法を見つけた人がいるが、公式に保証されたやり方ではなさそう。)
生成AIについて、ソフトウェアエンジニア視点で下記のような問いを立てた。急速に進歩している分野で、全てに完全な答えを出すことはできないだろうが、おおよその見通しが立てられるよう、下調べをしておく。