Chol-Gyu / joint_research

0 stars 0 forks source link

藤田研 #1

Open Chol-Gyu opened 3 years ago

Chol-Gyu commented 3 years ago

4月14日 今日やること DockerとJupyterの環境構築 (その上で)井上さんのプログラムを動かす 動いたらMerge request Okってする

→うまく動かなかったからnotebookをpushして井上さんに明日相談するかな そこからやな

https://github.com/blakeliu/awesome-cell-detection-segmentation にいろいろ論文とか載ってる

Chol-Gyu commented 3 years ago

AWSができるように ランダムで時系列データを作ってそれの解析→スパースとか?

Chol-Gyu commented 3 years ago

8月4日に藤田先生のとこと打ち合わせ 見せるデータは統計解析 ただ問題が 1.前後で被ってるてんがあるよね、それはどうしよう   →それは過大評価にならないか   →被ってるものを抽出しとく? 2.Caスパークをまとめた理由は? 3.サンプル数の偏りをどうするか? 4.

Chol-Gyu commented 3 years ago

やること 1.1細胞ごとの変動グラフ作成→横山さん 2.統計方法を検討→ポワソン分布解析、negaを普通の分布とし、5%の棄却率で考える→ワイ? 3.時系列の変更、今が50だから、100とか25とか、15とか、50がベストな気がする→横山さん 4.マテメソの作成(時間があるときに作っていく)https://docs.google.com/document/d/1lsoWhJJbRqwakXRQK0iEzEvRpEGiFjxJrjQmWeEYGOw/edit

Chol-Gyu commented 3 years ago

バイオインフォマティクス技術者認定試験を受ける? https://www.jsbi.org/activity/nintei/ 過去問メインでやっていこう、毎日1つづつ過去問を解いて課題を勉強する 立体構造とかエピゲノム関係とか全くわからんから 目的なく勉強するよりはなんか目的を持ってやったほうがいいからね 12月に受けれるかな? それができたら基本情報技術者試験かな https://www.jitec.ipa.go.jp/1_11seido/fe.html

Chol-Gyu commented 3 years ago

できたこと 1.1細胞ごとの変動グラフ作成 →一応やってもらったけど非常に見づらい。。。サンプル数が多いからやけどもう少し見やすくならないか検討。ここは明日、検討する。 /Users/chol/project/Joint_research/cell-competition/notebooks/feature_extraction/nuc/nuc_changes_per_frame_pre.ipynb 3.時系列の変更、今が50だから、100とか25とか、15とか、50がベストな気がする →これはできた。50が良さそうだと主張。上と合わせてポワソン解析もやる。明日中。 4.マテメソの作成(時間があるときに作っていく →ちまちまやっていく。

Chol-Gyu commented 3 years ago

3.時系列の変更、今が50だから、100とか25とか、15とか、50がベストな気がする →ここは正規分布に直してt検定する? →出てきた数値を3乗根してやればよさそう →まずはポアソン分布に従うという仮説を表示 →そこから3乗根すると正規分布になるよと表示 →じゃあt検定だよねって流れ →最悪統計やらんでもどうにかなりそうっぽいけど →とりあえず 要はCaありBefore, Afterとその他に違いがあればいい そこを仮説とするなら多重検定は必要ないわね

1細胞ごとの変動グラフ作成 →サンプル数が多いのが原因&一定の傾向が見られない まずサンプル数はいくつ? そこから強く動いた奴ら(閾値を設定して)を抽出?

Chol-Gyu commented 3 years ago

今日はt検定をおこなって有意差を出したけど…なにか違う? とりあえずちょっと改変して藤田先生に送る&ディスカッションしよう ようは50フレームが一番いいことを強調する クイックなミーティングだから井上さんとか一平さんとか入らなくてもいい? そんな感じで

Chol-Gyu commented 3 years ago

ミーティングは19日以降、来週中かもね やっぱり傾向がよく見えない。。。 ちょっと今後の方向性について横山さんと相談するか l1 trend filterをかけたあとのデータでやってみるとか? 本当ならここらへんは明日相談したかったのに明日の朝はワイがおらん。。。 明日の午後に相談しよう

Chol-Gyu commented 3 years ago

今見せているデータは生データ? l1トレンドフィルターをかけたあとのデータは取れそう? ソッチのほうが傾向がわかるかも。。。 もしそれをやってくれてそうならお手上げだな 念の為前後で共通しているもの、前だけ、あとだけで分けてもらう それで変化に共通性が見られるか 今週末か来週に藤田先生に相談するからそんな感じで

Chol-Gyu commented 3 years ago

藤田先生とのミーティング完了 黒宮さんいわく ・俺&数人は論文のCo author ・まだ執筆してない→投稿は10月ぐらいになりそう→藤田先生なら2日で書ける、すげえ ・こっちでマテメソなんかをどんどん書いていっていい

今後やること 今回の図ではPositiveだけでnegetiveがなかった なので今後はnegativeも入れた図を作る、negativeとpositiveの差がわかるような図を まずは素直にnegativeを入れた線を引く さらにそれをCa前後50フレームをあわせた図にする ここらへんはちょっと色々作ってみて考えましょう。 俺と横山さんの共同作業やな

横山さんのタスク ・前後をあわせたグラフ ・Negaの変化なしを入れる ・l1 trend filterをかませたもの、そうでないものの2パターン作る ・値は絶対値とnegaを基準とした相対値でどや

俺のタスク ・マテメソ作成

Chol-Gyu commented 3 years ago

次のミーティングでの相談事項 費用面の相談 ・投稿料は共同研究費から出してくださりますよね?ってこと

Chol-Gyu commented 3 years ago

もう少しで図は完成アンド提出 あとは横山さんの修正次第 マテメソも大体できた。 英訳して先生に送る。 そんなもんかな。 モジュール化に意外と手間取ってるみたい。。。 ここはゆっくりやってもらおう

Chol-Gyu commented 3 years ago

図の修正 ・細胞の挙動は全体で見てもわからないから、頻度が高いものについてピックアップして行う (上から10個ぐらい) ・面積と長径短径比に絞って行う ・挙動のときにpositiveの(Caスパークなし)をきちんと示す→これは多分出来てる、俺の説明ミス これを核と細胞と両方でやる。 →絶対値も見せることで納得してもらうか →ここは火曜に横山さんにやってもらって見せる

Chol-Gyu commented 3 years ago

本日結果を送った。 さてどういうコメントが来るか。 それ待ちで次に進むか。

藤田先生から sparkしてない細胞のほうがより歪んでるって話? トップ10点ではそうかもね、 ただ全部入れたらわからんけど、いや多分差は出ないけど

Chol-Gyu commented 3 years ago

やべえ、横山が10月から勤務減らすかもってよ そらそうよね、しゃーない そうすると俺の進捗も遅れるなー、どうしよう 特徴量増やすのは俺がやって、隣の細胞とかについては横山にやってもらう。 そういう2段構えでいこう そしたらどねいかなるかしら?

Chol-Gyu commented 3 years ago

ということで、特徴量を増やすことを一通りやった どうも見てみると前回と結果が違うけど、今回のほうがあってるっぽい… なので、今回の結果を正式な結果とする ま、Areaと長径短径比はもう出さないから、どうにかなるだろう 使ったfeaturesはperimeter(外周)、Area ratio(convex area/area)、eccentricityあたりですかね 結局、こいつらもCaがあると高くなるけど、変化に一定の傾向は見られないという結果になりそうだ。そらそうよ とりあえずこれで一旦まとめておこう。 今回はcytoだけ、nucは自分で閾値を決めるからそこは来週かな。 グラフを見て決めよう

Chol-Gyu commented 2 years ago

ぐちゃぐちゃになてきたから、一旦ここまでの流れを整理(横山バージョン) 目的:Caスパークが起きた周りの細胞の形態変化(頻度)を追う やったこと Caスパークの周辺細胞がどれだけ光っているか https://gitlab.com/hacarus/external/ai-drug-discovery/ku-fujitalab/cell-competition/-/blob/8-ca/notebooks/ca_signal_chain/ca_signal_chain.ipynb ・隣り合う細胞はけっこう同じタイミングで光ってる? ・大体100フレーム以内に光ってる印象 →この間に変化が起こっている or Ca waveとして捉える?

次に周辺細胞の変化頻度を見た。 1.中心でCa発火があった細胞

・Ca発火が起こった細胞 →まだ。でもあれか、ただCa発火があった細胞と比べればいいか?

2.中心でCa発火がなかった細胞 ・Ca発火がなかった周辺細胞 →100フレームで切ってる、多少変化してるかなって感じ → この感じだと中心のCa発火がないほうが変化頻度が高いってこと? → ただ直接の比較は難しいけどね。。。

・Ca発火があった周辺細胞 →まだ

とりあえずこの結果で報告するか で、この結果から次にやりたいことは。。。 やっぱりCa発火がなかった周辺でCa発火があった細胞の形態変化 →これは周辺のCa発火を基準に考えると。 そんな感じかな

Chol-Gyu commented 2 years ago

Ca発火がない細胞周辺でCa発火があったやつらの解析もやってもらった なんか微妙やな。。。 うーん、もう少し考えんとな

Chol-Gyu commented 2 years ago

11月25日に報告する それまでに資料を載せな ま、途中報告まででええから 1.複数特徴量 2.近隣細胞の特徴量

Chol-Gyu commented 2 years ago

CaスパークとかRasV12とかの影響を見るには統計量を出す(p値的な?F値的な?) もうちょっと充実した解析をするためには 細胞の変化について各フレームについて50フレームって決めているのを、フレーム数を振ってみて検討してみる データ量を増やしてもらえるか検討 スライドはこちら https://docs.google.com/presentation/d/160hdf54rIzqOBX-rXcATHkMkbz3pqejiHy9scdLPpKc/edit#slide=id.g10264fc06a7_0_24

Chol-Gyu commented 2 years ago

ミーティング終了、概ね高評価 そらそうよね、金をもらってなおかついろんな結果を見せてくれるんやから

藤田先生の感想 ・トライアングル法についてわからんから教えてほしい →説明資料を作っておく、勉強しとく

・藤田先生としては隣接細胞は変化しないかもと考えている →Caスパークが隣の細胞に伝わるかどうか →それを知りたい

・Caスパークが起こった隣でCaスパークが起こった細胞の解析について ある細胞でCaスパークがおきて、その後隣の細胞のCaスパークがおきた時、それは隣接細胞に惹起されたと言えるか? →それを見つけたい

・Caスパークが起こってない細胞の解析 →まずCaスパークが起こってない細胞を調べる必要がある →これは横山がやってくれてる? → 確認しよう

衝撃事実!CaスパークとCa waveは異なる Caスパークはいつでも起こる、Ca waveはRasV12から起こってその後で細胞競合を誘発する Caスパークでは上皮細胞の流動性が上がる→間接的に細胞競合に関わるかも?

Chol-Gyu commented 2 years ago

ちゅーこってやること 1.Caスパークが隣の細胞のCaスパークを誘発するかを確認する Caスパークが起こっているとこと起こっていないとことで隣接細胞のCaスパークの頻度、全体のCaスパークの頻度を調べて、ランダムかどうかを調べる。 ランダム性はベイジアンモデリングでわかる?  Pythonのpystan、PyMCが使える ・第一段階、起点となるCaの発火がランダムか、ポワソン分布に従うかどうか ・隣の細胞の発火も条件付きポワソン分布が書ける →ポワソンとフィッティングした場合と含めてどっちがフィッティングできるか? https://www.nogawanogawa.com/entry/bayesian_examples_2 https://qiita.com/0NE_shoT_/items/2b41ae3e8e8f2d8809c4

Chol-Gyu commented 2 years ago

2.Caスパークが起こってない細胞の解析 ・まずCa発火が起こってないところの周辺でCaスパークが起こってない細胞がどれだけあるかを選抜 ・追加画像が出たからそいつらの解析もやる 年内に終わればいいな、年明けに報告して終わりてきな感じかな?

Chol-Gyu commented 2 years ago

ちゅーこって、横山には1をやってもらう 追加画像まで含めて 1.Caスパークの隣接細胞の検出 2.Caスパークが起こってない細胞でCaスパークが起こった細胞の検出 3.画像全体のCaスパークの検出(フレームあたり、細胞あたり) ここから編集してもらう https://gitlab.com/hacarus/external/ai-drug-discovery/ku-fujitalab/cell-competition/-/blob/8-ca/notebooks/ca_signal_chain/ca_signal_chain.ipynb

Chol-Gyu commented 2 years ago

黒宮さんから追加画像をもらった。ただposiのsir-actinが薄い… これはもう1回取ってもらうか、どうにかなるんかな? ならんかったら画像をもらうのに時間がかかるかも。。。

Chol-Gyu commented 2 years ago

今日はモジュール化したものをmasterにmergeするためにconflictの解決に従事 うーん、この。。。 なんで横山はdevelopと6で別の作業をしたんやろ。。。 ま、中心なのは6だからdevelopを6の内容と置き換えてさらにmergeするか https://qiita.com/crarrry/items/c5964512e21e383b73da

Chol-Gyu commented 2 years ago

俺がやることはCaスパークが起こってない細胞の周辺でCaスパークが起こっていない細胞の解析 なんとなくやってくれてるから、そこをもう少し改変 https://gitlab.com/hacarus/external/ai-drug-discovery/ku-fujitalab/cell-competition/-/blob/8-ca/notebooks/ca_signal_chain/nuc/feature_change_frequency.ipynb

Chol-Gyu commented 2 years ago

追加データの解析について横山にデータアクセスの権限がないことが判明 ここを見ながら権限の変更ができる https://qiita.com/shisama/items/5f4c4fa768642aad9e06 なんか面白いね

Chol-Gyu commented 2 years ago

論文の原稿と図が届いた 問題点としては 1.Caスパークの求め方がうちと向こうで異なる 2.画像を1枚しか使っていない ってとこだったから、急遽再解析 1.については平均+5SDを基準にしてる 2.については無効から画像をもらった。 ということで、この解析を行う。

Chol-Gyu commented 2 years ago

ということで、どうにか終わった。 藤田先生に送りました、あとは投稿待ち。 今年中に投稿して来年中にアクセプトかな。 早ければ3ヶ月後ぐらい、ギリギリ年度内いけるか。

Chol-Gyu commented 2 years ago

Dev. Cellはなんとreject、次はNat. Comm.だってどんだけすごいんだ。ということで、次はここの結果待ち。

Chol-Gyu commented 2 years ago

Caの発火頻度について分布を調べてモデリングをしてもらってる。その際に必要なのが、モデルの目的変数と説明変数。説明変数は発火頻度、そこからどういうモデルを導きたいか。 →発火頻度のランダム性の評価。発火がランダムか、何かの分布に従ってるか。 これを参考にしてる https://qiita.com/0NE_shoT_/items/2b41ae3e8e8f2d8809c4 発火頻度分布はわかってる。それがどういう分布か、

Chol-Gyu commented 2 years ago

うん、よくわからんからよくわからんって言おう。 Ca発火の有無で分布の違いを見たい。 なのでピアソンのχ二乗検定でいいんかね。 あとは出してもらった奴らの検定はhttps://scikit-posthocs.readthedocs.io/en/latest/generated/scikit_posthocs.posthoc_wilcoxon/ でやってもらおう。双子葉類。

Chol-Gyu commented 2 years ago

notebookの整理で今後やること

Chol-Gyu commented 2 years ago

上を実行しとるけど想像以上に時間がかかる 1ファイル2時間、今回は 最初の画像:posi,nega合わせて8 次の画像:posi2、nega1 合計11画像あるから合計22時間!?ファッ!? でもしゃーないわね。このあとで色々仕掛けよう。 週末はずっとこいつら動かしとくか。