Closed kyakuno closed 5 months ago
Pythonの入力と出力
prompt 医療用語の訂正: こんにちは、先生。最近手足の経連があります。
token [[ 8 1551 3155 4 27421 42 8 13477 3 3546 5 6356
247 797 4 970 921 2929 5 1]]
encoder_outputs_prompt [[[-3.55517380e-02 -9.66443792e-02 6.48157671e-02 ... -6.34642988e-02
-7.90138617e-02 2.00392544e-01]
[ 1.37564301e-01 3.65253277e-02 -5.27102314e-02 ... 1.04192518e-01
-1.44698676e-02 -2.13405922e-01]
[ 1.02790155e-01 1.21800102e-01 2.19561234e-02 ... 1.85126532e-02
-1.31071806e-01 -2.30656326e-01]
...
[ 2.30483681e-01 1.16036333e-01 6.60178512e-02 ... 1.53649926e-01
1.33699514e-02 -1.22850209e-01]
[ 8.98660719e-02 1.30489081e-01 4.33537029e-02 ... 6.44744337e-02
-4.20348868e-02 2.03585342e-01]
[-2.52045915e-02 2.99085435e-02 1.18145794e-02 ... 2.17668582e-02
-1.93075466e-04 -1.10596623e-02]]]
new_tokens [8.0000e+00 1.3477e+04 3.0000e+00 3.5460e+03 5.0000e+00 6.3560e+03
2.4700e+02 7.9700e+02 4.0000e+00 2.6040e+03 5.0460e+03 2.9290e+03
5.0000e+00]
text こんにちは、先生。最近手足のけいれんがあります。
INFO t5_whisper_medical.py (290) : こんにちは、先生。最近手足のけいれんがあります。
出力トークンの期待値。
[[0]]
[[0 8]]
1%|▏ | 2/384 [00:00<00:25, 15.02it/s][[ 0 8 13477]]
[[ 0 8 13477 3]]
1%|▍ | 4/384 [00:00<00:23, 16.31it/s][[ 0 8 13477 3 3546]]
[[ 0 8 13477 3 3546 5]]
2%|▋ | 6/384 [00:00<00:23, 16.42it/s][[ 0 8 13477 3 3546 5 6356]]
[[ 0 8 13477 3 3546 5 6356 247]]
2%|▉ | 8/384 [00:00<00:24, 15.51it/s][[ 0 8 13477 3 3546 5 6356 247 797]]
[[ 0 8 13477 3 3546 5 6356 247 797 4]]
3%|█ | 10/384 [00:00<00:26, 14.22it/s][[ 0 8 13477 3 3546 5 6356 247 797 4 2604]]
[[ 0 8 13477 3 3546 5 6356 247 797 4 2604 5046]]
3%|█▎ | 12/384 [00:00<00:28, 13.16it/s][[ 0 8 13477 3 3546 5 6356 247 797 4 2604 5046
2929]]
[[ 0 8 13477 3 3546 5 6356 247 797 4 2604 5046
2929 5]]
CPP版の出力。
kyakuno@mbakk t5_whisper_medical % ./t5_whisper_medical -e 1
env_id : 0 type : 0 name : CPU
env_id : 1 type : 1 name : CPU-AppleAccelerate
env_id : 2 type : 2 name : MPSDNN-Apple M2 (Warning : FP16 backend is not worked this model)
selected env name : CPU-AppleAccelerate
Input : 医療用語の訂正: こんにちは、先生。最近手足の経連があります。
Input Tokens :
8 1551 3155 4 27421 42 8 13477 3 3546 5 6356 247 797 4 970 921 2929 5 1
Output : こんにちは、先生。最近手足のけいれんがあります。
Output Tokens :
1227969608 1227969608 1227969608 1227969608 1227969608 1227969608 1227969608 1227969608 1227969608 1227969608 1227969608 1227969608 1227969608 1227969608
Program finished successfully.
C++サンプルを作る。 https://github.com/axinc-ai/ailia-models/tree/master/natural_language_processing/t5_whisper_medical