Open ninopira opened 3 years ago
https://www.theverge.com/2021/3/6/22316831/apple-store-imac-pro-base-model-while-supplies-last
早速データサイエンスに関係ないニュース iMacPro の発売が終わるらしい。個人的に、買うか一瞬悩んだ経緯がある
matplotlibの可視化のまとめページ
正直、 object指向で統一されていないので、「うーん」というお気持ちもあるが、かなり便利。
https://openai.com/blog/multimodal-neurons/#rf1
(最高に面白いのですが、半分も理解していない点ことをご容赦ください)
画像とテキストの紐付けを行ったCLIPでの各レイヤーの可視化手法の開発及び考察
CLIPの説明は省略。このpodcastの解説が非常にわかりやすい
前語りが長くなりましたが本編。
そもそもの背景として、人間の脳内に画像とテキストを同時に処理するニューロンがあることが2005年に発見されたらしい。そこで、CLIPでは画像とテキストをどのように処理しているかの検証を行った研究
ざっくり説明すると、各ラベルのついた画像をCLIPぶ突っ込み、一番反応したニューロンを可視化し、NNのノードがどのように画像を解釈しているかを可視化。
いわゆる不気味の谷的な感覚を感じる画像が掲載されているが、非常に納得がいく。
“How multimodal neurons compose”のセクションで触れられているテキスト分類に関しては、そのテキストの意味する概念の他単語(例えば、豚の貯金箱 = 金融 + おもちゃ)で発火したニューロンの線形和で表現できるらしい。この概念をさらに深掘りし、人間の感情であるsurprisedやintimateといった単語はどのような要素から構成されるかを深掘り。人間が「surprised」といっている裏にある暗黙の認識と同じ要素を元にCLIPも判断根拠を持っていることが非常に興味深い。
最後に、例えばpoodleの画像に”$”を沢山いれることで、画像分類の結果が豚の貯金箱に変わるといったattackも紹介。
全体を通してだが、NNがテキストと画像のマルチモーダルデータをどのように解釈しているかを可視化しており非常に面白い研究だと思いました。
https://connpass.com/event/204547/presentation/
「ここに鳥鳴いているのにアノーテーションがねぇぞ!!」といったmissing labelをどう対処するかが肝だったコンペ
「クラスごとに周波数領域の辞書を作り、学習時にクロップ(時間方向はラベル通り)」たり、「アノテーションがない部分のlossは計算しないmask loss」など面白手法が沢山知れた
実業務だと、「正しいラベルが付与されたデータの準備」を行うアプローチが最も根本的な解決策だが、どうしてもデータの準備が難しい場合は参考になるかもしれないですね。
https://www.preferred.jp/ja/news/pr20210304/
みんな大好きPFNの新作ロボット
鹿島建設との共同作成の建設現場での巡回ロボット。詳細はyoutubeをみてください。
ロボットについてはあまり詳しくないのでなんともですが、ものすごく賢いルンバという印象。いつかルンバもこれくらい賢くなるのですかね。
https://sansan.connpass.com/event/202716/
nino_piraの感想
https://techcon.dena.com/2021/
いやー。先週の金曜日はとてもやとてもオンライムで参加できる状況でなかったので資料公開ありがたい。。。
各自気になった資料を見てみることをオススメします。個人的にはAI技術の実応用と実験環境の整備 ~ DRIVE CHARTの脇見検知の画像分析のツラミ(痛く共感)とエッジデバイスを使用した実験環境のアーキテクチャ、ドライブレコーダの動画を使った道路情報の自動差分抽出のシステム構成の話が非常に面白かったです。
https://tech.connehito.com/entry/2021/03/01/155041
lambdaとかaws batchで定期的にECSのjobを実行しなくとも、こんなことできるのですねー。 クラウドのキャッチアップしんどいっすね苦笑
オープニングトーク
満をじして公開!! NeWorks + githubで公開していますが、もっといい改善案があれば案を某集中