GENZITSU / UsefulMaterials

34 stars 0 forks source link

almost weekly useful materials - 12/7 - #120

Open GENZITSU opened 1 year ago

GENZITSU commented 1 year ago

アクティブラーニングの手法を活用した物体認識における効率的なアノテーションツールの開発

隣接ピクセルに含まれるクラス種類数と予測ラベルのエントロピーを用いた不確実性指標RIPUを元にしたアクティブラーニングをアノテーションツールとして実装した事例の紹介

RIPUの計算方法

RIPUとはTowards Fewer Annotations: Active Learning via Region Impurity and Prediction Uncertainty for Domain Adaptive Semantic Segmentation というCVPR2022で提案された指標で以下のように計算できる

スクリーンショット 2022-11-30 0 01 39

スクリーンショット 2022-11-30 0 01 48

RIPUを元に部分的にアノテーションしたデータによる学習結果

画像全体の5%程度のアノテーションで全体をアノテーションするのと同等程度の精度を得ている

スクリーンショット 2022-11-30 0 02 26

アノテーションツールへの組み込み

事前学習モデル or これまでアノテーションした結果を元に、予測ラベルを生成し、RIPUが一定以下の部分は事前にモデルがアノテーションし、不確実性が高いところだけ人によるアノテーションを依頼する

スクリーンショット 2022-11-30 0 03 42

組み込みの結果

数十枚程度ではあまり効果がみられないが、1000枚ほどやるとかなりやるようになる。

スクリーンショット 2022-11-30 0 05 08

コメント

アノテーションコストが特に高いセグメンテーションモデルに対するアクティブラーニングの手法を知れてよかった。 ざっくりとした実装例があるのも助かる。

出典

GENZITSU commented 1 year ago

エンジニアのためのマネジメントキャリアパス ~5章 チームの管理 ~

エンジニアのためのマネジメントキャリアパスを読んだので要点をまとめていく

エンジニアリングリードの職務

管理者にとって最も大切なこと

ITスキルの維持

機能不全に陥ったチームのでバック

同僚が自分の部下になってしまった場合

チームの盾となる

チームの意思決定を主導するコツ

チーム内の対立をコントロールするコツ

チームの結束を見出す人の対処

管理者が担当するべきプロジェクト管理

コメント

まだピンとくることが少ないが、今後のためにメモ

出典

エンジニアのためのマネジメントキャリアパス

GENZITSU commented 1 year ago

時系列向け深層学習ライブラリ tsai

時系列予測に関してこれまでSOTAを達成してきた深層学習モデルが実装されているライブラリ

かなり手軽に種々のモデルを試せそう

スクリーンショット 2022-11-30 23 15 59

スクリーンショット 2022-11-30 23 16 12

コメント

時系列モデルのSOTAの歴史をよく知らないが、チュートリアルも充実しているので便利そう

出典

GENZITSU commented 1 year ago

GPU管理ライブラリ genv

使用するGPU数やデバイス番号などを作業環境ごとに管理してくれるライブラリ

VScodeやjupyterlab拡張などもある模様

example

overview

overview_jupyterlab

コメント

チームで共用GPUサーバーを使う場合などに役立ちそう

出典

GENZITSU commented 1 year ago

エンジニアのためのマネジメントキャリアパス ~6章 複数チームの管理 ~

エンジニアのためのマネジメントキャリアパスを読んだので要点をまとめていく

技術部長の職務

時間の管理

意思決定と委任

よくない前兆

「ノー」を言うための戦略

チームの健全性の把握

チームプレイを重んじる

無精と短気の効用

コメント

今後のためにメモ

出典

エンジニアのためのマネジメントキャリアパス

GENZITSU commented 1 year ago

エンジニアのためのマネジメントキャリアパス ~7章 複数の管理者の管理 ~

エンジニアのためのマネジメントキャリアパスを読んだので要点をまとめていく

スキップレベルミーティング

部下の管理者に責任を課す

イエスマンな管理者とノーと言える管理者

新任管理者の管理

ベテラン管理者の管理

管理者の採用

自分が疎い分野のチームの管理

組織課題の改善

期日の見積もりと調整

ロードマップの不確実性への対処

技術力の維持・強化

コメント

今後のためにメモ

出典

エンジニアのためのマネジメントキャリアパス

GENZITSU commented 1 year ago

エンジニアのためのマネジメントキャリアパス ~8章 経営幹部 ~

エンジニアのためのマネジメントキャリアパスを読んだので要点をまとめていく

経営幹部に求められる素養

経営幹部の職務

技術系経営幹部の役割

以上のような役割を組み合わせて、CTOやVP, 本部長や主任アーキテクトなどに割り振る

技術担当VPとは

CTO

優先順位の変更

戦略の策定

悪いニュースの伝え方

非技術系の上司への対処

他部門の幹部仲間

自身が持つ影響について考える

恐怖の文化に陥らないために

基準値の設定

コメント

難しい...

出典

エンジニアのためのマネジメントキャリアパス

GENZITSU commented 1 year ago

エンジニアのためのマネジメントキャリアパス ~9章 文化の構築 ~

エンジニアのためのマネジメントキャリアパスを読んだので要点をまとめていく

文化や構造なしでたどり着ける限界

不都合が起きた場合に構造の修正・改善を試みる

組織文化とは

コアバリューの活用

キャリアラダー作成のコツ

職能の枠を超えたチーム

作業プロセスの見直し

意思決定プロセスから属人性を排除する

コメント

ここら辺の話は下っ端の自分も日頃から実践できることが多い

出典

エンジニアのためのマネジメントキャリアパス

GENZITSU commented 1 year ago

姿勢推定を用いたキャラクター画像検索

キャラクター画像に姿勢推定を行い特徴点の相対位置関係を元に類似ポーズ画像を検索する取り組みの紹介

bizarre-pose-estimatorを用いてイラスト用の姿勢推定は実施している。大元の論文はTransfer Learning for Pose Estimation of Illustrated Characters @WACV2022とのこと。

アルゴリズム

  • 検索対象の各キャラクターを囲むバウンディングボックスと25個の特徴点を求める
  • 特徴点をウンディングボックスの長辺の長さで正規化する
  • 正規化された各特徴点間ユークリッド距離を保存する
  • 正規化された特徴点間の距離を利用することで、並進・回転・拡大・縮小に対して不変の特徴量を得ることができます。特徴点は25個あるので 25C2 =300次元ベクトルになります。

これは著者が開発している画像検索サイトで試験的に導入されていて、事前に計算しておいた姿勢特徴量に対して、入力した姿勢模型から算出される特徴量とのマッチを元に検索している。割といい感じである。

スクリーンショット 2022-12-04 11 20 55

コメント

ざっと調べた感じ姿勢検索という取り組み自体は近年研究されていない感じに見える。
なので、ここで提案されているアルゴリズムは結構いいものなのかもしれない。

計算量簡略化のため、ユーザーに模型を動かさせるという方法も良き

出典

GENZITSU commented 1 year ago

類似事例を使って要約モデルの性能を向上させる

要約を作成する際に、本文とその類似文書に付与されている要約文を合わせてconcatして推論させることで精度を上げる手法を朝日新聞のデータを用いて検証した記事。

元論文はACL2022に採択されているTraining Data is More Valuable than You Think: A Simple and Effective Method by Retrieving from Training Data

論文ではデータセットによって効果が出ないものもあったが軒並み精度向上を果たしている

スクリーンショット 2022-12-04 12 35 17

日本語記事で試した結果はこちら

スクリーンショット 2022-12-04 12 36 50

筆者によると似たような論文にRetrieve, Rerank and Rewrite: Soft Template Based Neural SummarizationがACL2018で既に採択されており、使用してるモデルが違うくらいしか差がないらしい。 まぁ精度が上がっていることが重要と言えばそうだが...

コメント

持ってくる類似文章をどういう基準で選定するかでかなり要約の質が変わってきそう。
元のアイデアとなっているRe3Sumでは機械翻訳やQ&Aでも成功しているらしいので、文書に対する分類や回帰などでも使えるかもしれない。

出典