Closed akiFQC closed 3 months ago
src/jmteb/embedders/base.py
TextEmbedder
_chunk_size
TextEmbedder.encode
src/jmteb/embedders/data_parallel_sbert_embedder.py
DataParallel
起動時torchrunではなくpythonで起動すると理解合っていますでしょうか?
torchrun
python
はい。pythonで起動してください。
関連する Issue / PR
PR をマージした後の挙動の変化
挙動の変更を達成するために行ったこと
src/jmteb/embedders/base.py
のTextEmbedder
に_chunk_size
という変数を追加し、_chunk_size
ごとにTextEmbedder.encode
を呼ぶように変更src/jmteb/embedders/data_parallel_sbert_embedder.py
追加し、sentence-transfermersでpytorchのDataParallel
による複数GPU推論が可能になった。動作確認