Open GENZITSU opened 1 year ago
エンジニアのためのマネジメントキャリアパスを読んだので要点をまとめていく
まだピンとくることが少ないが、今後のためにメモ
時系列予測に関してこれまでSOTAを達成してきた深層学習モデルが実装されているライブラリ
かなり手軽に種々のモデルを試せそう
時系列モデルのSOTAの歴史をよく知らないが、チュートリアルも充実しているので便利そう
使用するGPU数やデバイス番号などを作業環境ごとに管理してくれるライブラリ
VScodeやjupyterlab拡張などもある模様
チームで共用GPUサーバーを使う場合などに役立ちそう
エンジニアのためのマネジメントキャリアパスを読んだので要点をまとめていく
今後のためにメモ
エンジニアのためのマネジメントキャリアパスを読んだので要点をまとめていく
今後のためにメモ
エンジニアのためのマネジメントキャリアパスを読んだので要点をまとめていく
以上のような役割を組み合わせて、CTOやVP, 本部長や主任アーキテクトなどに割り振る
難しい...
エンジニアのためのマネジメントキャリアパスを読んだので要点をまとめていく
ここら辺の話は下っ端の自分も日頃から実践できることが多い
キャラクター画像に姿勢推定を行い特徴点の相対位置関係を元に類似ポーズ画像を検索する取り組みの紹介
bizarre-pose-estimatorを用いてイラスト用の姿勢推定は実施している。大元の論文はTransfer Learning for Pose Estimation of Illustrated Characters @WACV2022とのこと。
アルゴリズム
- 検索対象の各キャラクターを囲むバウンディングボックスと25個の特徴点を求める
- 特徴点をウンディングボックスの長辺の長さで正規化する
- 正規化された各特徴点間ユークリッド距離を保存する
- 正規化された特徴点間の距離を利用することで、並進・回転・拡大・縮小に対して不変の特徴量を得ることができます。特徴点は25個あるので 25C2 =300次元ベクトルになります。
これは著者が開発している画像検索サイトで試験的に導入されていて、事前に計算しておいた姿勢特徴量に対して、入力した姿勢模型から算出される特徴量とのマッチを元に検索している。割といい感じである。
ざっと調べた感じ姿勢検索という取り組み自体は近年研究されていない感じに見える。
なので、ここで提案されているアルゴリズムは結構いいものなのかもしれない。
計算量簡略化のため、ユーザーに模型を動かさせるという方法も良き
要約を作成する際に、本文とその類似文書に付与されている要約文を合わせてconcatして推論させることで精度を上げる手法を朝日新聞のデータを用いて検証した記事。
元論文はACL2022に採択されているTraining Data is More Valuable than You Think: A Simple and Effective Method by Retrieving from Training Data。
論文ではデータセットによって効果が出ないものもあったが軒並み精度向上を果たしている
日本語記事で試した結果はこちら
筆者によると似たような論文にRetrieve, Rerank and Rewrite: Soft Template Based Neural SummarizationがACL2018で既に採択されており、使用してるモデルが違うくらいしか差がないらしい。 まぁ精度が上がっていることが重要と言えばそうだが...
持ってくる類似文章をどういう基準で選定するかでかなり要約の質が変わってきそう。
元のアイデアとなっているRe3Sumでは機械翻訳やQ&Aでも成功しているらしいので、文書に対する分類や回帰などでも使えるかもしれない。
アクティブラーニングの手法を活用した物体認識における効率的なアノテーションツールの開発
隣接ピクセルに含まれるクラス種類数と予測ラベルのエントロピーを用いた不確実性指標RIPUを元にしたアクティブラーニングをアノテーションツールとして実装した事例の紹介
RIPUの計算方法
RIPUとはTowards Fewer Annotations: Active Learning via Region Impurity and Prediction Uncertainty for Domain Adaptive Semantic Segmentation というCVPR2022で提案された指標で以下のように計算できる
RIPUを元に部分的にアノテーションしたデータによる学習結果
画像全体の5%程度のアノテーションで全体をアノテーションするのと同等程度の精度を得ている
アノテーションツールへの組み込み
事前学習モデル or これまでアノテーションした結果を元に、予測ラベルを生成し、RIPUが一定以下の部分は事前にモデルがアノテーションし、不確実性が高いところだけ人によるアノテーションを依頼する
組み込みの結果
数十枚程度ではあまり効果がみられないが、1000枚ほどやるとかなりやるようになる。
コメント
アノテーションコストが特に高いセグメンテーションモデルに対するアクティブラーニングの手法を知れてよかった。 ざっくりとした実装例があるのも助かる。
出典