vistec-AI / mt-opus

English-Thai Machine Translation with OPUS data
19 stars 5 forks source link

Try out an idea of using Google's USE to filter out sentence pairs that are not aligned #2

Closed lalital closed 4 years ago

lalital commented 4 years ago

Try out an idea that if using Universal Sentence Encoder to find a similarity, could it detect sentence pair that is not aligned with each other.

For example

  1. English: That's a lot of shit. Thai: [ผมสัญญาว่าจะทำอุปกรณ์กีฬาให้ดี จัดตั้งกรุ๊ปมิตติ้งกับหญิงโรงเรียนคังซาน; ] [ลดการบ้านให้น้อยลง...

  2. English: Mom, I don't like it here. Thai: 45; 04 โอ พระเจ้า!

  3. English: It seems a rather terrible gentleman on death row confessed to all the crimes you're accused of. Thai: ไอแซค?427 00; 29;

Criteria for filtering out a sentence pair:

where similarity function is defined as similarity(source, target) = np.inner( UniversalSenenceEncoder(source), UniversalSenenceEncoder(target))

Todos:

Result:

  1. Sentence pairs with similarity less than or equal to k:

Examples of sentence pairs with similarity score for all bins (from 0.000 to 0.450), where the bin size is 0.01:

similarity > -1.000 and similarity <= 0.000
index=1462: count=1: ผบ <<-->> Commander Schultz escaped. <<-->> similartity = -0.023868
index=1615: count=2: ท่านจะทำยังไงต่อไป <<-->> I had the ground covered. <<-->> similartity = -0.023339
index=2504: count=3: ที่คุณจะไปไหน <<-->> An actor's life is fun <<-->> similartity = -0.010431
index=6613: count=4: ฉันหวังว่าเฉพาะเมื่อฉันเป็นคน เก่า <<-->> All right. <<-->> similartity = -0.033326
index=6623: count=5: พวกเราจะมีอาหารมื้อเย็น <<-->> What have you got? <<-->> similartity = -0.101354
index=8097: count=6: โดยไม่มีแหวน <<-->> Something must be done. <<-->> similartity = -0.047372
index=8103: count=7: เด็กที่น่ารักและคือธรรมชาติ <<-->> They expect it, don't they. <<-->> similartity = -0.055986
index=8105: count=8: หนึ่งจดใช่ไหม คุณรู้ว่าฉันหมายถึง อะไร <<-->> Adoration hasn't gone to their heads. <<-->> similartity = -0.080634
index=8158: count=9: ความเข้าใจอย่างฉับพลัน <<-->> Ho! <<-->> similartity = -0.077092
index=8228: count=10: แหวนวงนี้ได้หมายถึงอะไรกับคุณ? <<-->> Stepney. <<-->> similartity = -0.019521
Total =  21815

------

similarity > 0.000 and similarity <= 0.010
index=971: count=1: โทไมเนีย <<-->> Stand by for further commentary. Go ahead, Tomainia. <<-->> similartity = 0.004186
index=8314: count=2: ไม่ย่อท้อในที่สุด นักวิทยาศาสตร์ที่ ใกล้ที่สุด <<-->> (Electronic beeping) <<-->> similartity = 0.009256
index=8423: count=3: คุณบอกว่าสิ่งนั้นคืออะไร? <<-->> Find out. <<-->> similartity = 0.009888
index=8590: count=4: กรุ๊ปเลือดของฉันคือ <<-->> Look! <<-->> similartity = 0.005412
index=8767: count=5: มีข้อสงสัยเกี่ยวกับมันไม่เรากำลัง เสี่ยง <<-->> No. And again. <<-->> similartity = 0.000786
index=8803: count=6: เงียบสงบ ถือ อย่างต่อเนื่อง <<-->> Come on, lets have you. <<-->> similartity = 0.001090
index=8856: count=7: ประตูกับดักนี้ <<-->> What? <<-->> similartity = 0.006525
index=8932: count=8: ฉันแม่ของเขาและเขาก็คือเด็กดี <<-->> Do you know where Clang is? <<-->> similartity = 0.007027
index=8948: count=9: ลองกลับไปและได้รับพวกเขาใช่มั้ย <<-->> That's all gab disembowelling... <<-->> similartity = 0.009808
index=9065: count=10: เราได้มีการได้รับมันแปล <<-->> (AIgernon) I don't think so. <<-->> similartity = 0.001941
Total =  4196

------

similarity > 0.010 and similarity <= 0.020
index=2450: count=1: ถ้าเราเล่นไพ่ของเราได้เรา จะ <<-->> Listen. <<-->> similartity = 0.011655
index=7041: count=2: ไม่ <<-->> I should have some luck. <<-->> similartity = 0.013461
index=8491: count=3: นักวิทยาศาสตร์ของพวกเขามีการ ติดตั้งอย่างถูกต้องใช่มั้ย <<-->> If I had a Luger... <<-->> similartity = 0.014820
index=8892: count=4: คุณทำให้ฉันพูด <<-->> Another girl <<-->> similartity = 0.019256
index=8993: count=5: เขาคือของฉัน <<-->> Help! <<-->> similartity = 0.015296
index=9034: count=6: อนิจจามีดผ่าตัด <<-->> He was asked to take it up. Alas... <<-->> similartity = 0.018118
index=9040: count=7: ฉันคือนายจ้างที่ดี <<-->> Fix it! <<-->> similartity = 0.014850
index=10413: count=8: ดำเนินริบบิ้นสีฟ้า <<-->> But even a pig has his moment. <<-->> similartity = 0.011062
index=10438: count=9: เมื่อฉันได้บอกฉันจะเป็นทหาร ของคุณ <<-->> (yells) <<-->> similartity = 0.017959
index=10504: count=10: คุณสามารถบอกได้โดยเหงื่อ <<-->> We were bound to have one. <<-->> similartity = 0.018832
Total =  4552

------

similarity > 0.020 and similarity <= 0.030
index=3007: count=1: ที่จะได้ยินว่าพูดคุยด้วงที่ คุณคิด <<-->> Ha! <<-->> similartity = 0.021063
index=4429: count=2: ใช่มั้ย <<-->> You can't understand what my feelings were, can you? <<-->> similartity = 0.025917
index=8253: count=3: เขามีสามชั่วโมงจะมีชีวิตอยู่ <<-->> Soup, yeah. <<-->> similartity = 0.025530
index=8295: count=4: แหวนวงนี้ไม่ได้คือหิน <<-->> Some of them matrimonial. (Laughs) <<-->> similartity = 0.021001
index=8321: count=5: มันเรียงลำดับของขั้วยาว <<-->> What's your electricity bill like? <<-->> similartity = 0.027071
index=8346: count=6: แรงดันขึ้น <<-->> Did he do a lot of it? <<-->> similartity = 0.027667
index=8347: count=7: ฉันไม่มีมือที่หมายถึงไม้เก่า <<-->> Voltage... up! <<-->> similartity = 0.029790
index=8348: count=8: สิ่งที่ฉันเองที่คุณรู้ว่า <<-->> I'm no mean hand at the old sticks. <<-->> similartity = 0.027054
index=8703: count=9: เท่านั้นที่เคยมีให้ฉัน <<-->> (Engine revs) <<-->> similartity = 0.022102
index=9072: count=10: เรามีสองกองพัน <<-->> I don't think so... <<-->> similartity = 0.021714
Total =  4889

------

similarity > 0.030 and similarity <= 0.040
index=4689: count=1: ได้ครับท่าน <<-->> It's almost empty. Very good, sir. <<-->> similartity = 0.039075
index=8102: count=2: พวกเขาคาดว่ามัน <<-->> Shall I? <<-->> similartity = 0.031064
index=8417: count=3: ในตอนท้ายของชั่วคราว <<-->> (Birds chirp) <<-->> similartity = 0.031854
index=8610: count=4: มันสำหรับคุณที่มีชื่อเสียง ริงโก้ <<-->> (Man) 'Ringo, please. <<-->> similartity = 0.036862
index=8730: count=5: ฉันเสียใจที่สูญเสียร้อยตรีคือสามารถ คือ อามี <<-->> 1-500. <<-->> similartity = 0.034480
index=8928: count=6: นี้คืออะไร? <<-->> Very nice of him, though. <<-->> similartity = 0.034769
index=10161: count=7: ของผิวและความกล้าและความ อดทน <<-->> To the front, salute! <<-->> similartity = 0.032406
index=10479: count=8: เขาบอกว่าให้ฉันและหมีในใจ เราอยู่ <<-->> I did. <<-->> similartity = 0.034215
index=10825: count=9: น้ำจะเปลี่ยน <<-->> Italia/ <<-->> similartity = 0.036019
index=11090: count=10: อย่าพยายามที่หนึ่ง <<-->> I remember the number of my first rifle. <<-->> similartity = 0.037755
Total =  5201

------

similarity > 0.040 and similarity <= 0.050
index=669: count=1: เดอะควีนเก่ากลับกลอกหนึ่ง <<-->> The... <<-->> similartity = 0.041959
index=2511: count=2: จากร้านค้าที่ดีที่สุดเฮ้ ปีโนก <<-->> Hey, Pinoke. <<-->> similartity = 0.048918
index=6537: count=3: ฉันสามารถไปและได้รับ <<-->> Yes? <<-->> similartity = 0.046663
index=6579: count=4: หากคุณเป็นผู้ชายของฉัน <<-->> Yes. <<-->> similartity = 0.047778
index=6757: count=5: ตอนนี้เขามีด้านข้างในปากของ เขา <<-->> What a fish! <<-->> similartity = 0.046314
index=8492: count=6: คิดเกี่ยวกับมัน <<-->> Their scientists are properly equipped. <<-->> similartity = 0.041254
index=10174: count=7: ให้ด้านหลังของ คุณลง <<-->> Personal? <<-->> similartity = 0.040804
index=10642: count=8: มีจำนวนมากของความสนุกที่ จะได้เป็น <<-->> It's not all death. <<-->> similartity = 0.045517
index=10753: count=9: และฉันหนึ่ง <<-->> It represents tradition, Musketeer. <<-->> similartity = 0.047888
index=10965: count=10: ขณะที่เรากำลังทำดีที่สุดของเรา หรือไม่ <<-->> And have them whipped? <<-->> similartity = 0.040872
Total =  5382

------

similarity > 0.050 and similarity <= 0.060
index=2555: count=1: ลาก่อน? ฮะ? <<-->> Hi diddle dee dee An actor's life for me <<-->> similartity = 0.053047
index=4748: count=2: ท่านผู้พันครับในฐานะผู้รักษากฎหมาย <<-->> and laboriously knock holes through the bottom of it? Come, Colonel. <<-->> similartity = 0.052542
index=7171: count=3: คุน DJE เลื่อน <<-->> Kun dje luen. <<-->> similartity = 0.050152
index=8234: count=4: เฮย, อับดุล <<-->> Or we did have. <<-->> similartity = 0.053445
index=8263: count=5: ขอโทษนะที่เคารพ ถ้าเขาคือการคือ <<-->> I can say no more. Excuse me. <<-->> similartity = 0.051735
index=8304: count=6: แม้ราชวงศ์ฮันโนเวอร์ <<-->> Not the wheel. <<-->> similartity = 0.059870
index=8495: count=7: ไห่? <<-->> (Continues speaking in Eastern language) <<-->> similartity = 0.051834
index=8559: count=8: ระวัง รับไป <<-->> No, I haven't. Look out! Get away! <<-->> similartity = 0.053468
index=8722: count=9: เฮย ระวังถัง <<-->> Faster! <<-->> similartity = 0.052887
index=8820: count=10: เครื่องเป่าผม <<-->> (Cadenza starts) <<-->> similartity = 0.056902
Total =  5801

------

similarity > 0.060 and similarity <= 0.070
index=507: count=1: ไม่ไม่ไม่ไม่ได้รับความตื่นเต้น! <<-->> That's the tub. <<-->> similartity = 0.060023
index=884: count=2: โอ้ย.. เรื่องขี้หมา <<-->> I can try. <<-->> similartity = 0.067671
index=1032: count=3: ฉันก็มีมือ มีเท้า ที่จะมีการโต้ตอบแกบ้าง <<-->> Not one of you has the guts to stand up alone and fight! <<-->> similartity = 0.064696
index=1884: count=4: เซ็นบุ๊บ ไปบั๊บ <<-->> Then I remove my troops after. <<-->> similartity = 0.060616
index=3933: count=5: จริงเหรอ จริงเหรอ <<-->> Do you? <<-->> similartity = 0.065427
index=4750: count=6: แล้วจะอะไรอีกล่ะครับ <<-->> Of murder? <<-->> similartity = 0.062897
index=8612: count=7: มีเพียงฉันและ พอล รู้ว่าเราอยู่ที่นี่ <<-->> It's them. <<-->> similartity = 0.062356
index=9013: count=8: ได้รับมัน ใช้เวลาไม่นานก็มันได้ หรือไม่ <<-->> (AIgernon) Got it. <<-->> similartity = 0.062551
index=9028: count=9: เล็ก ๆ น้อย ๆ ที่พวกเขารู้ว่าเขาคือ นักโทษ <<-->> Ringo! <<-->> similartity = 0.064311
index=10771: count=10: ชักออก! <<-->> Is it right a butcher should... <<-->> similartity = 0.068201
Total =  6078

------

similarity > 0.070 and similarity <= 0.080
index=889: count=1: จะต้องไปส่งเอกสารสำคัญ <<-->> Hold on to these dispatches. <<-->> similartity = 0.072648
index=1321: count=2: ก็มีผมสีน้ำตาล <<-->> Of the world! <<-->> similartity = 0.076878
index=3053: count=3: เขาเป็นไม่ได้ที่นี่ <<-->> Look. <<-->> similartity = 0.070314
index=3124: count=4: นั่นคงวิตกกังวล <<-->> Whoa! Steady there, Nellie. <<-->> similartity = 0.070214
index=3885: count=5: ใส่สิครับ ไม่ประมาทไว้ก่อน <<-->> Yes, certainly, certainly, certainly. You can't be too careful with children. <<-->> similartity = 0.071984
index=8311: count=6: ไม่ ครั้งที่ฉันใช้ในการปล่อยให้มันมี <<-->> Did you want them to? No. <<-->> similartity = 0.073625
index=8341: count=7: นั่นคือสิ่งที่ฉันสุนัขจิ้งจอก <<-->> Wrong voltage. <<-->> similartity = 0.072826
index=8358: count=8: น่าอัศจรรย์ ด้วยแหวนเหมือนนั้นฉันสามารถทำ ได้, <<-->> Fantastic! <<-->> similartity = 0.079257
index=8446: count=9: มันคือชุดที่ดีที่สุด ของเขา <<-->> Where are you, Paul? <<-->> similartity = 0.076587
index=8594: count=10: ฉันยุ่งมาก <<-->> No... ( Band plays anthem) <<-->> similartity = 0.078018
Total =  6199

------

similarity > 0.080 and similarity <= 0.090
index=955: count=1: อดีนอย เฮนเคิล กล่าวและฉันแปล <<-->> Adenoid Hynkel said, "Tomainia was down but today has risen." <<-->> similartity = 0.080309
index=3951: count=2: อ้อ ขอบคุณค่ะ <<-->> Won't you sit down? <<-->> similartity = 0.083715
index=4553: count=3: ไม่ว่าพวกเขาจะถามอะไรคุณ.. <<-->> I promise. <<-->> similartity = 0.087524
index=8136: count=4: พวกเขาทั้งหมดมีลักษณะเดียวกัน <<-->> My gosh. <<-->> similartity = 0.085538
index=8142: count=5: อา ชิลลิง ชิลลิง? <<-->> All in together now, sir. Now. Ah! <<-->> similartity = 0.086338
index=8157: count=6: ทุกคนหัวเราะ ริงโก้ส์ <<-->> Ho, ho! Ho! Ho, ho! <<-->> similartity = 0.080656
index=8274: count=7: แค่นี้เหรอ? <<-->> Three hours to live. <<-->> similartity = 0.087557
index=8279: count=8: ตั๋วฤดูกาล <<-->> What's this? <<-->> similartity = 0.081132
index=8422: count=9: หาใช่มั้ย <<-->> I wouldn't think of such a thing! <<-->> similartity = 0.085806
index=8450: count=10: ระวัง พวกเขากำลังที่ผ่านมาทาง ประตู <<-->> Look out! <<-->> similartity = 0.087673
Total =  6289

------

similarity > 0.090 and similarity <= 0.100
index=1991: count=1: แถว... ตรง <<-->> Attention! <<-->> similartity = 0.096428
index=2027: count=2: เสือกับกวางอยู่ถ้ำเดียวกันไม่ได้ ในเมื่อเราเป็นเสือ <<-->> They are inferior and therefore enemies of the state. <<-->> similartity = 0.091897
index=2879: count=3: ปิโนคีโอ <<-->> What's yours? <<-->> similartity = 0.094969
index=3791: count=4: พอกลับมาบ้านปุ๊บ ก็ออกปั๊บ เป็นอย่างงี้ทุกทีเลย <<-->> How tiresome of him not to be here when we arrive, and how typical. <<-->> similartity = 0.094499
index=6716: count=5: บางทีวันนี้ <<-->> But who knows? <<-->> similartity = 0.093481
index=6718: count=6: มันจะดีกว่าที่จะโชคดี <<-->> Every day is a new day. <<-->> similartity = 0.092006
index=8083: count=7: อามี เจ้านายการเตรียมการที่จำคือ <<-->> Monstrous. Ahme. <<-->> similartity = 0.094676
index=8382: count=8: คุณต้องซ่อนความรักของคุณออกไป <<-->> His brain's draining. <<-->> similartity = 0.098208
index=8433: count=9: คุณคุณคุณและคุณ <<-->> Synchronise your watches. <<-->> similartity = 0.090553
index=8441: count=10: มาสิ, นิ้วของฉัน <<-->> (Hollering) <<-->> similartity = 0.097527
Total =  6322

------

similarity > 0.100 and similarity <= 0.110
index=267: count=1: จมูกของฉัน! <<-->> Take them away. <<-->> similartity = 0.106701
index=1375: count=2: ไอ้ยิว เอฟสติน ถุย <<-->> Epstein refuses, eh? <<-->> similartity = 0.105728
index=1407: count=3: รูปสะท้อนแสงได้ <<-->> A fine photo on each! <<-->> similartity = 0.100839
index=1614: count=4: ไหนว่ามีแค่เรา <<-->> You let him steal a march on us. <<-->> similartity = 0.107252
index=3626: count=5: รอเดี๋ยว เรารู้สึกซาบซึ้งมากเลยครับ คุณนายแวน ฮอปเปอร์ <<-->> Just a minute. <<-->> similartity = 0.103183
index=6740: count=6: วิธีที่มันมีความสดใหม่ <<-->> Please eat them. <<-->> similartity = 0.103725
index=7541: count=7: เธอยังคงขึ้น? <<-->> Yes. <<-->> similartity = 0.109054
index=8046: count=8: แหวน <<-->> Halt? <<-->> similartity = 0.108731
index=8214: count=9: มันถูกโยนไปที่เด็กและเยาวชน <<-->> Sex is creeping in. <<-->> similartity = 0.102985
index=8232: count=10: เราได้มีหนึ่งในนั้น <<-->> I tell a lie. <<-->> similartity = 0.105647
Total =  6601

------

similarity > 0.110 and similarity <= 0.120
index=1005: count=1: มันไม่แน่นอนหรอก <<-->> Now you said it. <<-->> similartity = 0.112803
index=1027: count=2: เซ็น.. ไว้ก่อน <<-->> Just charge it to my account! <<-->> similartity = 0.116593
index=1092: count=3: ความเป็นธรรมไม่มีอีกต่อไปแล้ว <<-->> All right, they've gone. <<-->> similartity = 0.111974
index=1564: count=4: ทำเวลา <<-->> Take this. <<-->> similartity = 0.111934
index=1832: count=5: มันเป็นข้ออ้างที่ดี <<-->> It'll carry weight. <<-->> similartity = 0.119443
index=1992: count=6: วันทยา... .. วุธ <<-->> Present arms! <<-->> similartity = 0.118347
index=2559: count=7: ฉันจะทำงานและบอก พ่อ ของ เขา <<-->> Hi diddle dee day An actor's life is gay <<-->> similartity = 0.111123
index=4270: count=8: จริงเหรอ แล้วพัดของฉันอยู่ไหนล่ะ <<-->> Do you really think so? <<-->> similartity = 0.111311
index=6626: count=9: ฉันมี <<-->> You can't fish and not eat. I have. <<-->> similartity = 0.118613
index=8104: count=10: ฉันหมายถึงว่าความรักยังไม่ได้ไปถึง หัวของพวกเขา <<-->> Lovely lads and so natural. <<-->> similartity = 0.115371
Total =  6712

------

similarity > 0.120 and similarity <= 0.130
index=1600: count=1: ออสตินลิค <<-->> Osterlich! <<-->> similartity = 0.120353
index=3652: count=2: อ้า ใจตรงกันกับเราเลย <<-->> Somebody else had the same idea. <<-->> similartity = 0.124437
index=7051: count=3: คุณอาจ <<-->> Two bad hands? <<-->> similartity = 0.120211
index=7147: count=4: และนำมาให้ฉันและเอกสาร <<-->> And... <<-->> similartity = 0.122937
index=8095: count=5: ในมือและแล้วรอ <<-->> ...visit to England. <<-->> similartity = 0.127535
index=8096: count=6: สิ่งที่จะต้องทำ <<-->> In hand. <<-->> similartity = 0.128698
index=8225: count=7: ไม่ ไม่ดีกับฉันเพื่อน <<-->> It's yours. Nah! <<-->> similartity = 0.120247
index=8254: count=8: อย่าพูดอีกเลย ฉันสามารถพูดอีก ไม่ได้ <<-->> He has three hours to live. Say no more. <<-->> similartity = 0.124758
index=8285: count=9: ฉันจะได้รับทุกประเภท <<-->> in a fan letter. <<-->> similartity = 0.121971
index=8361: count=10: และการลักขโมยของคุณช่วยกึ่ง มนุษย์ <<-->> Algernon, the laser. <<-->> similartity = 0.126346
Total =  6927

------

similarity > 0.130 and similarity <= 0.140
index=1193: count=1: เซ็น.. ไว้ก่อน <<-->> Borrow it! <<-->> similartity = 0.133146
index=1200: count=2: ยากที่จะทำสำเร็จ ที่จะกู้เงิน เอฟสติน เขาเป็นยิว <<-->> It might be difficult in view of our policy towards his people. <<-->> similartity = 0.135850
index=1611: count=3: เพื่อบุก ออสตินลิค <<-->> To take Osterlich! <<-->> similartity = 0.130216
index=1921: count=4: ฉันดิ้นเหมือนหนอนโดนน้ำร้อน <<-->> My little bambino! <<-->> similartity = 0.137504
index=2300: count=5: อ๋อ ติดตลาด <<-->> Temptations. <<-->> similartity = 0.135876
index=2901: count=6: อา เพียงเพื่อความ สนุกสนานของมัน <<-->> Why? <<-->> similartity = 0.131074
index=6756: count=7: สิ่งที่ปลา! <<-->> He's going to take it. <<-->> similartity = 0.136614
index=8094: count=8: จะทำ ในครั้งเดียว เยี่ยมชมไปยัง ประเทศอังกฤษ <<-->> Are made. At once. <<-->> similartity = 0.131100
index=8144: count=9: ในขณะนี้ ไป มักจะไป <<-->> Oh, shilling! Now! Off! <<-->> similartity = 0.132116
index=8474: count=10: ต้องทำด้วยตัวเองทั้งหมดนี้คุณรู้ว่า ใช่เลย <<-->> A couple of bob, at least. Had to do all this myself... <<-->> similartity = 0.135359
Total =  6985

------

similarity > 0.140 and similarity <= 0.150
index=832: count=1: เคลีย พื้นที่ <<-->> Stand clear! <<-->> similartity = 0.140871
index=842: count=2: ให้ตายสิ เผ่นเร็ว <<-->> Look out! Run! <<-->> similartity = 0.149738
index=1056: count=3: เร็วเข้า ไสหัวออกไป <<-->> Come on, get out of here! <<-->> similartity = 0.149304
index=1395: count=4: จำเอาไว้ ทุกสิ่งที่คุณทำจะล้ม <<-->> Very well, but remember my words. <<-->> similartity = 0.148989
index=1594: count=5: พวกแกอยู่ไหน <<-->> Here's your friend. <<-->> similartity = 0.141263
index=1606: count=6: แด่ ออสตินลิค <<-->> To the invasion of Osterlich! <<-->> similartity = 0.140762
index=3343: count=7: สวัสดีค่ะ สวัสดีครับ <<-->> How do you do? <<-->> similartity = 0.142410
index=3443: count=8: ไม่เอาน่า ทานเยอะๆ เถอะครับ <<-->> Come on. <<-->> similartity = 0.148199
index=3532: count=9: คุณพระช่วย มานี่เร็ว <<-->> For the love of Pete! Come here! <<-->> similartity = 0.141266
index=3678: count=10: สวัสดีค่ะ สวัสดีค่ะ ฉันเตรียมทุกอย่างพร้อมแล้วสําหรับคุณ <<-->> How do you do? <<-->> similartity = 0.143403
Total =  7544

------

similarity > 0.150 and similarity <= 0.160
index=414: count=1: ลัปล แดปลินส <<-->> Lumple dapplins? <<-->> similartity = 0.157522
index=1613: count=2: แกแหกตาฉัน <<-->> You can't believe it! <<-->> similartity = 0.154287
index=1978: count=3: ทำอย่างไรดี <<-->> Looking this way. <<-->> similartity = 0.156096
index=1988: count=4: ใจเย็นๆ <<-->> There's no hurry. <<-->> similartity = 0.159296
index=4264: count=5: แน่ใจนะว่าถูกตําแหน่งแล้ว <<-->> Because the first people will be arriving any moment. Now, you're sure that's where that should be? <<-->> similartity = 0.159852
index=4659: count=6: เอ้าดื่มนี่สักหน่อย <<-->> Here, try a spot of this. <<-->> similartity = 0.157006
index=4691: count=7: เหม็นควันรึครับ <<-->> Does this bother you? <<-->> similartity = 0.152581
index=4778: count=8: ครับท่าน <<-->> Very good. <<-->> similartity = 0.151918
index=4983: count=9: เป็นปีที่มันเริ่มต้นขึ้น <<-->> The machine goes into action. <<-->> similartity = 0.153239
index=8122: count=10: ฉันเหนื่อย <<-->> What are you doing on the floor? <<-->> similartity = 0.150211
Total =  7717

------

similarity > 0.160 and similarity <= 0.170
index=1529: count=1: แล้ว ผบ. ล่ะ <<-->> Where's the Commander? <<-->> similartity = 0.169409
index=1677: count=2: ปูพรม เร็ว <<-->> Lay it down here. Quick. <<-->> similartity = 0.164258
index=2902: count=3: เอาล่ะ แลมปี <<-->> Ah, just for the fun of it. Okay, Lampy. <<-->> similartity = 0.165087
index=3371: count=4: แหม <<-->> Well, I... <<-->> similartity = 0.169673
index=3374: count=5: เธอมันเก่งสารพัดนี่นา <<-->> You're a capable child in many ways. <<-->> similartity = 0.162793
index=3472: count=6: มาได้สักที เร็วเข้า ฉันอยากเล่นไพ่แล้ว <<-->> Oh, there you are. It's about time. Hurry up. <<-->> similartity = 0.162512
index=4040: count=7: อย่าโง่ไปหน่อยเลย <<-->> I'll go upstairs. <<-->> similartity = 0.162247
index=8140: count=8: โอเค ๆ ทุกอันเข้า <<-->> Yes, yes. Right, right. <<-->> similartity = 0.160433
index=8802: count=9: มาสิ, ช่วยให้มีคุณ <<-->> Quick! <<-->> similartity = 0.163257
index=8939: count=10: ลองหาวัดที่ใช่มั้ย <<-->> Let's smash them! <<-->> similartity = 0.163660
Total =  7851

------

similarity > 0.170 and similarity <= 0.180
index=1215: count=1: ไม่ถึงไหน <<-->> Very slow. <<-->> similartity = 0.175175
index=1260: count=2: แล้วผมโกนเคราให้คุณทำไม <<-->> Isn't that foolish of me? <<-->> similartity = 0.175072
index=1399: count=3: แกมันขัดต่อคำปฏิญาณ <<-->> You're a double-dyed democrat! <<-->> similartity = 0.170685
index=1480: count=4: โดยผู้นั้นได้จากการจับฉลาก <<-->> At a feast by lottery the victim was chosen. <<-->> similartity = 0.171745
index=1641: count=5: ไม่ครับ ไข้หวัดลงคอ ครับ <<-->> No, I mean he can't talk. <<-->> similartity = 0.175702
index=1771: count=6: เยี่ยมมากๆ เชิญ <<-->> Very well, this way. <<-->> similartity = 0.175193
index=1886: count=7: เพื่อให้แน่ใจว่าคุณจะไม่โกง <<-->> You said I remove first. <<-->> similartity = 0.171132
index=1990: count=8: ให้สัญญาน <<-->> Sound assembly! <<-->> similartity = 0.172459
index=2271: count=9: เอ่อโอ้เอ่อ <<-->> Uh, oh, uh, Cricket's the name. <<-->> similartity = 0.176342
index=4239: count=10: ครับท่าน <<-->> Yes, sir, thank you. <<-->> similartity = 0.179755
Total =  8259

------

similarity > 0.180 and similarity <= 0.190
index=1305: count=1: หยวนๆให้พวกเขาหน่อยล่ะกัน <<-->> Cannot afford to be lenient. <<-->> similartity = 0.183946
index=1405: count=2: ก็ใช่ <<-->> Most amusing. <<-->> similartity = 0.183702
index=1792: count=3: ที่ลานสวนสนาม และผู้ชมเกือบครึ่งล้าน <<-->> The Hynkel stadium. <<-->> similartity = 0.189678
index=1793: count=4: การสวนสนามที่ยิ่งใหญ่ของกองทัพ <<-->> Before half a million spectators the greatest ever display of arms marches by in review. <<-->> similartity = 0.186106
index=2419: count=5: ใช่ <<-->> But hurry now. <<-->> similartity = 0.189237
index=2560: count=6: ไม่มีที่ต้องการจะแจ้ง <<-->> No, that'd be snitching. <<-->> similartity = 0.189930
index=3062: count=7: ทำไมเอ่อเอ่อมันบอกว่าที่นี่เขา เอ่อ <<-->> Where is he? <<-->> similartity = 0.182744
index=3416: count=8: ไม่ค่ะ คุณแม่ฉันเสียไปหลายปีแล้ว <<-->> No. <<-->> similartity = 0.186151
index=3507: count=9: รู้มั้ยค่ะฉันหวังว่าจะมีสิ่งประดิษฐ์. <<-->> You know, I... <<-->> similartity = 0.181553
index=3529: count=10: แต่ไม่จําเป็นต้องเรียกเต็มยศ เรียกสั้นๆ ว่า "แม็กซิม" ก็ได้ <<-->> You needn't bother with them all at once. <<-->> similartity = 0.189333
Total =  8560

------

similarity > 0.190 and similarity <= 0.200
index=841: count=1: ครับผม ตรวจฉนวน <<-->> Yes, the fuse. <<-->> similartity = 0.194607
index=844: count=2: เครื่องบิน ข้าศึก <<-->> Air raid. After Big Bertha. <<-->> similartity = 0.191840
index=1037: count=3: ฉันไม่ได้ทำร้ายใคร แต่ฉันเป็นผู้ให้มากกว่า <<-->> Don't rob the poor girl, boys. Give her back her tomatoes. <<-->> similartity = 0.197945
index=1845: count=4: อดีนอย ที่รัก <<-->> My dear Adenoid. <<-->> similartity = 0.193400
index=3403: count=5: ได้ครับ คุณผู้หญิง <<-->> I'll just have some scrambled eggs. Oui, mademoiselle. <<-->> similartity = 0.197334
index=3523: count=6: เอาเลย เปิดประตูแล้วลงไปเลย <<-->> Go on. <<-->> similartity = 0.198352
index=3735: count=7: อ้อ มีอีกเรื่อง <<-->> Oh, yes... <<-->> similartity = 0.199146
index=4652: count=8: ดีมากมัลเลนช่วยกลับรถให้ด้วย <<-->> No, that's fine. Pull around the corner. <<-->> similartity = 0.193758
index=4990: count=9: แบบบ้านริมเขา <<-->> Alpine style. <<-->> similartity = 0.192954
index=6752: count=10: เขาจะต้องได้รับการเปิดอีก <<-->> God knows he can't have gone. <<-->> similartity = 0.195884
Total =  9100

------

similarity > 0.200 and similarity <= 0.210
index=27: count=1: ฉันหวังว่าฉันหวัง <<-->> I'm hoрing -I'm hoрing <<-->> similartity = 0.206424
index=457: count=2: ทำไมเงียบไป? <<-->> Cat got your tongue? <<-->> similartity = 0.207935
index=836: count=3: เคลีย พื้นที่ <<-->> Stand clear. <<-->> similartity = 0.201752
index=917: count=4: มันล้ำลึกเกินฉันจะเข้าใจ <<-->> I can't reach it. <<-->> similartity = 0.201063
index=1030: count=5: ทุกคนมีสิทธิ์จะได้มัน <<-->> If I were a man I'd show you. <<-->> similartity = 0.203793
index=1034: count=6: หุบปาก <<-->> Shut up! <<-->> similartity = 0.200298
index=1282: count=7: เมื่อไหร่คุณจะเซ็น <<-->> I'll get you a pen. <<-->> similartity = 0.205763
index=1622: count=8: หุบปาก <<-->> Shut up! <<-->> similartity = 0.200298
index=1681: count=9: หุบปาก <<-->> Shut up! <<-->> similartity = 0.200298
index=1686: count=10: ไงสหาย <<-->> My friend! <<-->> similartity = 0.205573
Total =  9429

------

similarity > 0.210 and similarity <= 0.220
index=878: count=1: ขอบใจหลาย ในความกรุณา โทไมเนีย ภูมิใจที่มีนาย <<-->> Thank you. I'll see you get the Tomainian Cross for this. <<-->> similartity = 0.212922
index=1394: count=2: จับ ชูลท์ซ <<-->> Place Schultz under arrest. <<-->> similartity = 0.219263
index=1972: count=3: เราจะผ่านมันเหรอ <<-->> Through the woods? <<-->> similartity = 0.216321
index=2850: count=4: อาฮะ ตอนนี้หัวใจว่า <<-->> Aha! <<-->> similartity = 0.217791
index=3752: count=5: คุณผู้หญิงครับ <<-->> I slipped. <<-->> similartity = 0.218172
index=3800: count=6: สวัสดี <<-->> How do you do? <<-->> similartity = 0.211196
index=4029: count=7: ตุ๊กตากามเทพกระเบื้องเคลือบครับ <<-->> China cupid, sir. <<-->> similartity = 0.212378
index=4771: count=8: ในอีกไม่กี่สัปดาห์ ที่จริง ทุกๆ ครั้งที่หล่อนเป็นลม <<-->> Every time she faints, in fact. <<-->> similartity = 0.211467
index=7094: count=9: ไม่มีอะไร ฉันเพียงแค่เดิน ออกไปไกลเกินไป <<-->> Nothing. <<-->> similartity = 0.217503
index=7375: count=10: ร่มเย็น <<-->> Be peaceful. <<-->> similartity = 0.216339
Total =  10012

------

similarity > 0.220 and similarity <= 0.230
index=968: count=1: ผู้นำของคุณ <<-->> This is the Pari-Mutual network, bringing you <<-->> similartity = 0.227621
index=1083: count=2: เดี๋ยวเล่าให้ฟัง <<-->> More are coming! <<-->> similartity = 0.228855
index=1196: count=3: เอฟสติน <<-->> Epstein. <<-->> similartity = 0.222171
index=1323: count=4: หรือ ซีซ่า หรือ นุนลูส <<-->> Aut Caesar aut nullus. <<-->> similartity = 0.221860
index=1562: count=5: ถุงกอร์ฟผม <<-->> My golf clubs! <<-->> similartity = 0.220092
index=1959: count=6: แผนบุก ออสตินลิค <<-->> The invasion of Osterlich. <<-->> similartity = 0.224031
index=1984: count=7: เราใส่เกียร์ 2 เลยดีไหม <<-->> We could walk faster. <<-->> similartity = 0.221481
index=2936: count=8: เอาล่ะ แลมปี <<-->> Okay, Lampy. <<-->> similartity = 0.225348
index=3187: count=9: เรื่องอะไร? <<-->> Pinocchio! Wh Wh <<-->> similartity = 0.226996
index=3673: count=10: สวัสดีคะ <<-->> How do you do? <<-->> similartity = 0.221670
Total =  10586

------

similarity > 0.230 and similarity <= 0.240
index=1114: count=1: หัวหน้าหน่วย <<-->> First in command. <<-->> similartity = 0.236695
index=1115: count=2: รองหัวหน้าหน่วย <<-->> Second in command. <<-->> similartity = 0.238905
index=1199: count=3: เจ๋ง ช่างมัน เราจะใช้เครดิต เอฟสติน <<-->> Well, let's be big about it. We'll borrow from Epstein. <<-->> similartity = 0.232645
index=1244: count=4: ตลกสิ้นดี ไม่รู้เมื่อไหร่เขาจะทอดทิ้งเร <<-->> Funny how they've left us alone. <<-->> similartity = 0.232011
index=1337: count=5: จะเป็น ซีซ่า หรือ นูนลูส <<-->> Aut Caesar aut nullus. <<-->> similartity = 0.236642
index=1808: count=6: กระจอก <<-->> Very light! <<-->> similartity = 0.233705
index=2899: count=7: มาสิ, ให้เป็นไป ใน <<-->> Oh, boy, a scrap! <<-->> similartity = 0.235518
index=3482: count=8: ไปเหล่ครูสอนหนุ่มรูปหล่อ.. <<-->> I see. I suppose you've had a look at the pro, and he's desperately handsome, and you've conceived a schoolgirl crush on him. <<-->> similartity = 0.231042
index=4033: count=9: ทําไม่ต้องมากวนใจผมด้วยเรื่องพวกนี้ด้วย นี่มันหน้าที่คุณไม่ใช่หรือ ที่รัก <<-->> Why do they come to me with these things? <<-->> similartity = 0.230518
index=4986: count=10: ความเป็นชาติแบบนาซี ก็เริ่มต้นขึ้น <<-->> The nation gets down to work. <<-->> similartity = 0.233652
Total =  11549

------

similarity > 0.240 and similarity <= 0.250
index=879: count=1: ผมเต็มใจช่วย ครับผม <<-->> Only too willing to oblige, sir. <<-->> similartity = 0.240544
index=934: count=2: วิธีที่เธอดูแลมัน <<-->> How she loves daffodils! <<-->> similartity = 0.243570
index=1304: count=3: ให้มันขึ้นรถไฟที่นั่งVIP สายด่วนไปนรก <<-->> Let's train others first, then shoot them! <<-->> similartity = 0.243789
index=1346: count=4: สนธิสัญญา อยู่ที่ อดีนอย เฮนเคิล เด็กๆแห่งสัญญาดับเบิล-คลอส <<-->> At six, Adenoid Hynkel will address the children of the double-cross. <<-->> similartity = 0.247900
index=1822: count=5: การ์บริทซ เราจะบุก ออสตินลิค <<-->> Garbitsch! The invasion of Osterlich. <<-->> similartity = 0.246836
index=1895: count=6: ไม่ไม่ส่งผลดีต่อพวกคุณเลย <<-->> This won't get us anywhere. <<-->> similartity = 0.244520
index=3105: count=7: เกิดอะไรขึ้น? ไม่สามารถเป็น เพื่อนเอ่อฉันเป็น <<-->> What's the matter? <<-->> similartity = 0.243427
index=3918: count=8: เร็วสิวะ แจสเปอร์ <<-->> Hurry up, Jasper, for heaven's sake. <<-->> similartity = 0.244006
index=4218: count=9: ก็ได้ ทูนหัว <<-->> All right, my sweet. <<-->> similartity = 0.244557
index=4719: count=10: ไปกันฟาเวล <<-->> Come on, Favell. Let's go. <<-->> similartity = 0.241117
Total =  11603

------

similarity > 0.250 and similarity <= 0.260
index=901: count=1: มันสว่างจริงๆ <<-->> Shining upwards. <<-->> similartity = 0.252650
index=1461: count=2: เอาล่ะ ทางปลอดโปร่ง <<-->> All right, the coast is clear. <<-->> similartity = 0.250854
index=1475: count=3: ไม่เป็นไร ฉันรับผิดชอบเอง รอดูล่ะกัน <<-->> Don't worry, I've fixed everything. Wait and see. <<-->> similartity = 0.258210
index=1502: count=4: นี่มันไม่ตลกนะ <<-->> What's the meaning of this? <<-->> similartity = 0.256710
index=2299: count=5: ติดตลาด? <<-->> Temptations? Yep. <<-->> similartity = 0.250891
index=2986: count=6: ฉันอยากกลับบ้าน! <<-->> Open up! <<-->> similartity = 0.251312
index=3008: count=7: นะ "กำลังจะเกิดขึ้นกับเรา <<-->> To hear that beetle talk, you'd think somethin' was going to happen to us. <<-->> similartity = 0.259626
index=3821: count=8: ครับ คุณผู้หญิง <<-->> Unfortunately, yes, madam. <<-->> similartity = 0.252997
index=3824: count=9: น่ากินเชียว <<-->> What a plateful. <<-->> similartity = 0.254653
index=3861: count=10: ลาก่อน แม็กซิม <<-->> Well, goodbye, Maxim, old boy. <<-->> similartity = 0.251101
Total =  12112

------

similarity > 0.260 and similarity <= 0.270
index=801: count=1: เท่านั้น? <<-->> Onlу for you <<-->> similartity = 0.267236
index=948: count=2: พูดเป็นเล่น <<-->> What? <<-->> similartity = 0.264099
index=1163: count=3: เฮอลิง อยู่ที่บนป้อม <<-->> Herring here in the tower room. <<-->> similartity = 0.264325
index=1404: count=4: เฮนเคิล ฉันคิดว่าเขาก็ดีนะ <<-->> That Hynkel isn't such a bad fellow after all. <<-->> similartity = 0.268622
index=1406: count=5: เข็มกลัด เฮนเคิลครับ <<-->> Get a Hynkel badge! A Hynkel badge! <<-->> similartity = 0.268756
index=1434: count=6: ไปจัดการหนูสกปรกกัน <<-->> Let's kill the louse! <<-->> similartity = 0.265923
index=1767: count=7: มันอยู่ไหน <<-->> Is that so? <<-->> similartity = 0.263826
index=1969: count=8: เร็วเข้า <<-->> Come on. <<-->> similartity = 0.263597
index=2846: count=9: คุณเห็นอะไร? <<-->> Close your eyes. <<-->> similartity = 0.267733
index=3153: count=10: มาสิ, ปีโนก อย่ารอคอยสำหรับ ฉัน <<-->> Come on, Pinoke. <<-->> similartity = 0.262824
Total =  13329

------

similarity > 0.270 and similarity <= 0.280
index=265: count=1: ดู กอลเดนรอด <<-->> Look, goldenrod. <<-->> similartity = 0.279192
index=896: count=2: เรารู้จักกันหรอ <<-->> Don't you know me? <<-->> similartity = 0.278781
index=1117: count=3: ชั่งมัน <<-->> You! <<-->> similartity = 0.278739
index=1311: count=4: หน้าที่ผม ผมจัดการเอง <<-->> That's my department. I'll attend to that. This way. <<-->> similartity = 0.279798
index=1320: count=5: และท่านเอง <<-->> And a brunette dictator. <<-->> similartity = 0.274533
index=1514: count=6: อันตรายอยู่รอบตัวคุณ อดีต ผบ. ชูลท์ซ <<-->> "Mystery surrounds the disappearance of ex-Commander Schultz." <<-->> similartity = 0.278425
index=1585: count=7: ครับผม <<-->> Yes, sir. <<-->> similartity = 0.272398
index=1605: count=8: แด่ เฮอลิง <<-->> To Field Marshal Herring! <<-->> similartity = 0.276728
index=1623: count=9: ท่านจะทำอย่างนี้จริงๆหรอ <<-->> Will you sign this? <<-->> similartity = 0.276413
index=1645: count=10: นัดเขามา <<-->> Ask him to come here. <<-->> similartity = 0.274124
Total =  13796

------

similarity > 0.280 and similarity <= 0.290
index=863: count=1: มาเข้าแถว <<-->> Fall in! <<-->> similartity = 0.284441
index=925: count=2: เกาะไว้ <<-->> The stick! <<-->> similartity = 0.281280
index=954: count=3: อำนาจเด็ดขาดอยู่ที่เขาเพียงผู้เดียว <<-->> Only the voice of Hynkel was heard. <<-->> similartity = 0.281009
index=1187: count=4: ทำลายชุมชนยิว <<-->> An assault on the ghetto. <<-->> similartity = 0.286868
index=1310: count=5: ให้พวกมันเซ็นใบรับรอง <<-->> But mark them for future reference. <<-->> similartity = 0.286700
index=1945: count=6: รังเกียจเหรอ ฉันไม่รังเกียจ <<-->> Mind? I don't mind! <<-->> similartity = 0.288841
index=2018: count=7: รมต.มหาดไทย รมต.จิตวิทยาโฆษาณา <<-->> Secretary of the Interior, Minister of Propaganda... <<-->> similartity = 0.280918
index=2019: count=8: โคโลนา วีนีท ดีเล็คทริค <<-->> Corona veniet delectis. <<-->> similartity = 0.280143
index=2303: count=9: อาจจะถูกต้องในเวลาที่ผิด หรือเอ่อในทางกลับกัน <<-->> Or, uh, visa versa. <<-->> similartity = 0.288834
index=2829: count=10: สทรอมโบลี น่ากลัว <<-->> Stromboli was terrible. <<-->> similartity = 0.285620
Total =  14656

------

similarity > 0.290 and similarity <= 0.300
index=1025: count=1: จอดซะไกล แกตั้งใจใช่ไหม <<-->> Hold it there, will you? <<-->> similartity = 0.291505
index=1185: count=2: ประชากร ถุย <<-->> The people, bah! <<-->> similartity = 0.293705
index=1206: count=3: นี่อาจเป็นผลประโยชน์ เฮนเคิล <<-->> This Hynkel business. <<-->> similartity = 0.298478
index=1709: count=4: การพบปะนี้ต้องการให้เขาพอใจ ท่านควรหงอยๆครับ <<-->> This interview is to impress on him the force of your personality. <<-->> similartity = 0.299922
index=1759: count=5: และ ตรวจแถวสวนสนามครับ <<-->> And a review of the army. <<-->> similartity = 0.290141
index=1906: count=6: ถ้าอย่างนั้นเราก็ไม่ไปไหน <<-->> Then they remain. <<-->> similartity = 0.299985
index=2395: count=7: ฉันเข้าใจแล้ว! <<-->> Here's water! <<-->> similartity = 0.291100
index=2569: count=8: สิ่งที่สะสม <<-->> What a build-up. <<-->> similartity = 0.292169
index=3396: count=9: อย่าดีกว่าค่ะ <<-->> Oh, but I couldn't possibly. <<-->> similartity = 0.291890
index=3450: count=10: งั้นเหรอ <<-->> Does it? <<-->> similartity = 0.294982
Total =  15253

------

similarity > 0.300 and similarity <= 0.310
index=431: count=1: ฮะ! <<-->> Wash? <<-->> similartity = 0.301462
index=834: count=2: เตรียมไกปืน <<-->> Stand by your trigger! <<-->> similartity = 0.309330
index=972: count=3: ท่านผู้นำ มีปัญหากับการลงบรรได <<-->> His Excellency is about to descend the stairs. <<-->> similartity = 0.305402
index=990: count=4: นายจะบอกอะไรฉัน <<-->> What's good about it? <<-->> similartity = 0.306461
index=1033: count=5: แกคงหดอยู่บนรถ ถ้าฉันซัดแกใช่ไหม <<-->> Is the lorry in case someone hits back? <<-->> similartity = 0.309055
index=1222: count=6: เพื่ออะไ <<-->> What for? <<-->> similartity = 0.306192
index=1230: count=7: ฉันรู้ ฉันเคยมีความรู้สึกแบบนั้น <<-->> I know. I've seen you making eyes. <<-->> similartity = 0.300097
index=1500: count=8: เชิญ <<-->> Proceed! <<-->> similartity = 0.307147
index=1639: count=9: ท่านผู้นำเหรอ <<-->> His Excellency? <<-->> similartity = 0.306147
index=1851: count=10: แน่นอน เชิญ <<-->> Of course, this way. <<-->> similartity = 0.307304
Total =  16864

------

similarity > 0.310 and similarity <= 0.320
index=695: count=1: ดีลาก่อน, กรัมปี <<-->> Good-bye, Grumpy! <<-->> similartity = 0.316172
index=930: count=2: ฉันก็คิดว่าฉันต้องเลิกแล้ว <<-->> I shan't need this any more. <<-->> similartity = 0.314470
index=942: count=3: ต้องรีบส่งสาร.. <<-->> The dispatches... <<-->> similartity = 0.313517
index=1062: count=4: เชื่อคุณจริงๆ <<-->> I appreciate that. <<-->> similartity = 0.310879
index=1279: count=5: หยุดพิมพ์ <<-->> Full stop. <<-->> similartity = 0.312919
index=1360: count=6: ทำไมเป็นงั้น <<-->> Is that so? <<-->> similartity = 0.310876
index=1419: count=7: ตายก็ตายครั้งเดียว <<-->> We might as well die as live like this. <<-->> similartity = 0.314320
index=1468: count=8: ชูลท์ซ เขาคิดจะทำอะไรนะ <<-->> What does this Schultz want of us? <<-->> similartity = 0.319064
index=1499: count=9: สุภาพบุรุษ ถึงเวลาของ พุดดิ้งเกียรติยศแล้ว <<-->> Gentlemen, we have pledged our honor. <<-->> similartity = 0.313747
index=1571: count=10: เวลานี้ไม่เหมาะ <<-->> Take this. <<-->> similartity = 0.313194
Total =  17772

------

similarity > 0.320 and similarity <= 0.330
index=508: count=1: ไม่ได้รับไม่ได้รับการขึ้นไม่ได้ รับ <<-->> Don't, don't, don't, don't get excited! Don't get... <<-->> similartity = 0.329630
index=864: count=2: เฮ้แก ให้เร็วเลย <<-->> Hey you, come on! <<-->> similartity = 0.329951
index=906: count=3: ประมาณ11.59 <<-->> Approximately one minute to twelve. <<-->> similartity = 0.327093
index=950: count=4: อำนาจเป็นของเฮนเคิล ทหารยิวคนนั้น <<-->> Hynkel takes power. <<-->> similartity = 0.324744
index=1004: count=5: บางทีคุณอาจถูก มันอาจเป็นฟ้าหลังฝน <<-->> Perhaps you're right. Not such a good morning after all. <<-->> similartity = 0.324718
index=1113: count=6: ผบ.ซูลทซ์ <<-->> Commander Schultz! <<-->> similartity = 0.324547
index=1372: count=7: ข่าวร้ายครับ การบุก ออสตินลิค ถูกเลื่อนออกไป <<-->> Bad news. The invasion of Osterlich will have to be delayed. <<-->> similartity = 0.326679
index=1374: count=8: เอฟสติน ยกเลิกการเจรจากู้ยืนเงิน <<-->> Epstein refuses to lend the money. <<-->> similartity = 0.326012
index=1384: count=9: ไปสนุกกันให้เต็มที่ ในชุมชนยิว <<-->> A little mediaeval entertainment in the ghetto! <<-->> similartity = 0.325040
index=1503: count=10: ใครทำอย่างนี้ <<-->> Somebody made a fool of us. <<-->> similartity = 0.321109
Total =  18695

------

similarity > 0.330 and similarity <= 0.340
index=165: count=1: และมีความสุขด้วยกัน เราสามารถเป็นระเบียบ เรียบร้อยขึ้นสถานที่ <<-->> Аnd сheerfully together we сan tidy uр the рlaсe <<-->> similartity = 0.330116
index=850: count=2: ท่านครับ เราโดนโจมตีแล้วครับ มันตีฝ่าถึงแนวหน้าแล้ว <<-->> Sir, the enemy have broken through. Every man to the front. <<-->> similartity = 0.333786
index=865: count=3: เรียบ... อาวุธ <<-->> Order arms! <<-->> similartity = 0.333767
index=940: count=4: เราอยู่บนพื้น ต้องรีบส่งสาร <<-->> We've landed! Dispatches! <<-->> similartity = 0.334000
index=1314: count=5: คัดชื่อพวกมันออก <<-->> Then wipe them out! <<-->> similartity = 0.333019
index=1365: count=6: ที่รักของฉัน ดูมือเธอสิ <<-->> My dear! Those hands! What's the matter with them? <<-->> similartity = 0.335180
index=1401: count=7: ท่านผู้นำ นี่สุทรพจน์ของท่าน <<-->> Excellency, here are the notes for your speech. <<-->> similartity = 0.336792
index=1476: count=8: สุภาพบุรุษ ผมขอให้เขา ปล่อยตัวผมชั่วคราว <<-->> Gentlemen, may I claim your indulgence for a moment? <<-->> similartity = 0.338302
index=1580: count=9: ถุงกอร์ฟฉัน ไม่...  <<-->> My golf clubs, not my golf clubs! <<-->> similartity = 0.336889
index=1638: count=10: คุณจะไปตีกอร์ฟหรอครับ <<-->> You went round in 92? <<-->> similartity = 0.339842
Total =  19996

------

similarity > 0.340 and similarity <= 0.350
index=115: count=1: เมื่อเม็ดฝ? นมาไม้ลอย <<-->> When raindroрs сome tumbling <<-->> similartity = 0.349545
index=617: count=2: ฉัน หมายถึง <<-->> No, no! I mean... <<-->> similartity = 0.346281
index=918: count=3: น้ำหายไปไหน <<-->> It's all gone. <<-->> similartity = 0.344998
index=1198: count=4: ครับท่าน <<-->> Yes. <<-->> similartity = 0.344169
index=1259: count=5: ฉันสงสัยว่า ฉันมีเคราตั้งแต่เมื่อไหร่ <<-->> I wonder why women never grow whiskers. <<-->> similartity = 0.345951
index=1276: count=6: ไม่มีบทลงโทษ ฉันรักที่มันสงบสุข <<-->> With all the persecution, I still love it here. <<-->> similartity = 0.342265
index=1398: count=7: ไอ้ทรยศ กบฏ <<-->> Traitor! Traitor! <<-->> similartity = 0.346253
index=1487: count=8: เอ้า.. <<-->> Why? <<-->> similartity = 0.340643
index=1526: count=9: สายลับเหรอ <<-->> Spies? <<-->> similartity = 0.342126
index=1532: count=10: เถียงซักคำไหม <<-->> Am I arguing? <<-->> similartity = 0.340440
Total =  20617

------

similarity > 0.350 and similarity <= 0.360
index=29: count=1: ในสิ่งที่ดีในสิ่งที่ดี <<-->> The niсe things -The niсe things <<-->> similartity = 0.355559
index=818: count=2: ดีลาก่อน, กรัมปี <<-->> Good-bye, Grumpy. <<-->> similartity = 0.354379
index=840: count=3: ไปตรวจฉนวน <<-->> Check the fuse. <<-->> similartity = 0.358029
index=909: count=4: ฉันคอแห้งมาก <<-->> Water. Quick, I'm going to faint. <<-->> similartity = 0.357707
index=1014: count=5: คุณจะเอาอะไรอีกไหม <<-->> You need some more. <<-->> similartity = 0.357274
index=1024: count=6: เฮ้ รถมาแล้ว <<-->> Hey, the lorry. <<-->> similartity = 0.350974
index=1181: count=7: ไม่เห็นด้วยกับอะไร <<-->> Dissenting about? <<-->> similartity = 0.357531
index=1387: count=8: จริงหรอ <<-->> Indeed? <<-->> similartity = 0.350253
index=1472: count=9: ฉันรู้ แต่ชูลท์ซ เป่าหูพวกเรา <<-->> I know it but Schultz has them all hypnotized. <<-->> similartity = 0.358085
index=1511: count=10: หนังสือพิมพ์บอกว่า ชูลท์ซ อยู่ในชุมชนยิว <<-->> The papers say Schultz may be in the ghetto. <<-->> similartity = 0.359958
Total =  22382

------

similarity > 0.360 and similarity <= 0.370
index=401: count=1: ฉันเตือน 'ยา <<-->> I'm warnin' ya. <<-->> similartity = 0.368676
index=490: count=2: พวงของแพะพี่เลี้ยงเก่า ยาทำให้ฉันรู้สึกแย่ไป <<-->> Bunch of old nanny goats. <<-->> similartity = 0.361982
index=639: count=3: สาธุ <<-->> Amen. <<-->> similartity = 0.366009
index=869: count=4: ข้าศึก เร็วเข้า จัดการมัน <<-->> The enemy! Come on, let's get him! <<-->> similartity = 0.361535
index=937: count=5: ช่างหวาน ฮินดาที่รัก <<-->> Sweet, gentle Hilda. <<-->> similartity = 0.365789
index=1543: count=6: เขาจะต้องถามใครซักคน <<-->> They're always looking for somebody. <<-->> similartity = 0.368370
index=1671: count=7: เรื่องง่ายๆ <<-->> At ease! <<-->> similartity = 0.363450
index=1751: count=8: ไม้ขีด <<-->> Match. <<-->> similartity = 0.369267
index=1763: count=9: ถ่อมตัวจริงๆ <<-->> Modesty forbids. <<-->> similartity = 0.369717
index=1852: count=10: สุภาษิตของ โทไมเนีย บทหนึ่ง.. <<-->> There's a Tomainian proverb... <<-->> similartity = 0.365279
Total =  23330

------

similarity > 0.370 and similarity <= 0.380
index=30: count=1: เราจะบอกว่าเราจะพูดว่า <<-->> Нe'll say -Нe'll say <<-->> similartity = 0.379903
index=417: count=2: คแรปล ดัมกินส <<-->> Crapple dumpkins. <<-->> similartity = 0.372595
index=641: count=3: และกรุณ? าโทรกรัมปี เหมือนฉัน <<-->> And please make Grumpy like me. <<-->> similartity = 0.372399
index=670: count=4: เต็มรูปแบบของคาถา <<-->> The old Queen's a sly one, full of witchcraft. <<-->> similartity = 0.378025
index=849: count=5: แกคิดว่านี้ม้าหมุนรึยังไง แกมันบ้าสิ้นดี <<-->> What do you think you're doing? Have you gone crazy? <<-->> similartity = 0.373250
index=875: count=6: เฮ้ สหาย ช่วยฉันที <<-->> Comrade! Help! <<-->> similartity = 0.378621
index=1054: count=7: ปล่อยเขาไปเถอะ เขาก็แค่ความจำเสื่อม <<-->> Let him go. It isn't a serious case. <<-->> similartity = 0.376736
index=1137: count=8: เขาทำร้ายคนของผม ที่กำลังปฏิบัตหน้าที่ครับ <<-->> He resisted my men painting his windows. <<-->> similartity = 0.370148
index=1385: count=9: ตอนนี้หรอครับ ผมว่า มันตลกสิ้นดี <<-->> At such a time I think it ill-advised. <<-->> similartity = 0.377589
index=1449: count=10: เราจะไป ออสตินลิค ที่นั้นยังคงมีเสรี <<-->> We can go to Osterlich. That's still free. <<-->> similartity = 0.379439
Total =  24984

------

similarity > 0.380 and similarity <= 0.390
index=481: count=1: กอบสบู่ ตอนนี้ไม่ได้พยายามที่ จะตรงไปตรงมา <<-->> Piсk uр the soaр Now don't try to bluff <<-->> similartity = 0.381724
index=681: count=2: และให้แน่ใจว่าจะดูออกไปเพื่อ วาวา <<-->> And be sure to watch out... To wa... To wa... <<-->> similartity = 0.383039
index=952: count=3: เฮนเคิลได้ปกครองประเทศ ด้วยผเด็จการ <<-->> Hynkel ruled the nation with an iron fist. <<-->> similartity = 0.382161
index=1059: count=4: ที่นี้ถูกทิ้งร้าง <<-->> Leave that alone. <<-->> similartity = 0.380473
index=1296: count=5: เฉพาะหัวหน้าหรอ <<-->> The leader? <<-->> similartity = 0.384236
index=1380: count=6: มันจะได้รู้ว่าคนบ้าอำนาจนี้ ทำได้มากกว่าที่มันคิด <<-->> He'll deal with a mediaeval maniac more than he thinks! <<-->> similartity = 0.381236
index=1382: count=7: ท่านผู้นำ <<-->> Your Excellency? <<-->> similartity = 0.380548
index=1383: count=8: สั่งสารวัตรทหาร <<-->> Call out the storm troopers. <<-->> similartity = 0.388598
index=1422: count=9: นี่เป็นคำสั่งของ ชูลท์ซ ห้ามยุ่งกับยิวในนี้ <<-->> Schultz gave strict orders not to molest anyone in this court. <<-->> similartity = 0.384921
index=1749: count=10: ภรรยา คุณที่สถานีรถไฟ <<-->> Madam Napaloni at the station. <<-->> similartity = 0.389001
Total =  26063

------

similarity > 0.390 and similarity <= 0.400
index=144: count=1: อีเต้อ ถุงเท้ายาวเกินไป! <<-->> A pickaxe. A stocking, too! <<-->> similartity = 0.390710
index=222: count=2: เฮ-โฮ, เฮ-โฮ, เฮ-โฮ, เฮ <<-->> Нeigh-ho, heigh-ho, heigh-ho, heigh... <<-->> similartity = 0.398003
index=345: count=3: ฉันสงสัยว่าเ? ด็ก ๆ <<-->> I wonder if the children are... <<-->> similartity = 0.399660
index=742: count=4: มันได้ไปแดฟีลูกดิ่ง <<-->> They've gone plumb daffy. <<-->> similartity = 0.390813
index=1016: count=5: ส่งผ้าที่ร้านทำรองเท้า <<-->> Mrs. Shoemaker's laundry. <<-->> similartity = 0.395480
index=1019: count=6: อารยัน เราเป็น อารยัน <<-->> Aryan! We're Aryans! <<-->> similartity = 0.390339
index=1123: count=7: แปรขบวนแถว <<-->> Break ranks. <<-->> similartity = 0.395133
index=1129: count=8: แปลก และผมมักคิดว่า. <<-->> Strange. And I always thought of you as an Aryan. <<-->> similartity = 0.396773
index=1255: count=9: คนดีหลายๆคนจะบ๊องๆ มันเป็นตัวบ่งชี้ว่าคุณน่าหลงไหล <<-->> All great men are absent-minded. It's a sign you're smart. <<-->> similartity = 0.390605
index=1275: count=10: ฉันไม่อยาไปจากที่นี่ <<-->> I don't want to go. <<-->> similartity = 0.397175
Total =  27915

------

similarity > 0.400 and similarity <= 0.410
index=380: count=1: ก็ก็ของฉันรักของฉัน ควินเสส ปริ๊นเซ <<-->> Well... Well, my, my dear Quincess... Princess. <<-->> similartity = 0.405332
index=390: count=2: ใครรางน้ำ <<-->> Who's... Gutter... <<-->> similartity = 0.407372
index=810: count=3: ที่น่าตื่นเต้นฉันผ่านจริงดังนั้น <<-->> Thrilling me through -So true <<-->> similartity = 0.401288
index=855: count=4: เตรียมปะทะ ไปพร้อมๆกัน เร็วเข้า <<-->> Keep moving. Come along, hurry up! <<-->> similartity = 0.402629
index=885: count=5: แขนของฉัน มันเจ็บ <<-->> Lift my hand to the stick. I haven't the strength. <<-->> similartity = 0.406754
index=945: count=6: ฉันต้องไปพบ ผู้พัน ชเมลลาเฟอ <<-->> Take me to General Schmelloffel. <<-->> similartity = 0.400986
index=963: count=7: รมต.มหาดไทย <<-->> Now Herr Garbitsch, Minister of the Interior. <<-->> similartity = 0.403889
index=1046: count=8: ไม่รู้ สิ่งที่เขารู้คือ ร้านตัดผมของเขา <<-->> No. His one interest seems to be in his barbershop, which he believes he left a few weeks ago. <<-->> similartity = 0.400482
index=1095: count=9: เราควรจะโต้ตอบบ้าง <<-->> We should all fight back. <<-->> similartity = 0.406985
index=1116: count=10: โอ้ สภาพ. <<-->> Oh, never mind. <<-->> similartity = 0.407445
Total =  29211

------

similarity > 0.410 and similarity <= 0.420
index=208: count=1: สนีสี, ขี้เซา <<-->> Sneezy, Dopey... <<-->> similartity = 0.415672
index=686: count=2: แต่ที่ผ่านมาวา <<-->> But that's the last... Wha... <<-->> similartity = 0.419549
index=794: count=3: ฉันจะแก้ไขยา ฉันจะแก้ไขยา <<-->> I'll fix ya. I'll fix ya. <<-->> similartity = 0.412208
index=856: count=4: ประทานโทษ ครับท่าน มันใช้ยังไงเหรอ.. <<-->> Pardon me, but to work this... <<-->> similartity = 0.414757
index=890: count=5: ถ้าเราทำได้ <<-->> If we get them to General Schmelloffel, <<-->> similartity = 0.412645
index=892: count=6: ฉันกำลังหมดสติ <<-->> I'm going to faint. <<-->> similartity = 0.411372
index=979: count=7: เรื่องราวของท่านผู้นำ จะกลับมา พร้อมท่านผู้นำ เขาจะผ่านถนนแห่งเกียรติยศ เป็นผลงานที่ทันสมัย <<-->> His Excellency leaves the scene and will return along Hynkelstrasse, where he'll pass Tomainia's modern masterpieces <<-->> similartity = 0.412125
index=1001: count=8: เสียดาย มันถูกทิ้งไว้เปล่าประโยชน์ ทั้งหมดนานมาก <<-->> A pity it should be idle all these years. <<-->> similartity = 0.411034
index=1089: count=9: ฉันคิดว่าเป็นโก๋แถวนี้แหละ <<-->> I think it was a gang. <<-->> similartity = 0.417493
index=1207: count=10: นายอาจไม่รู้ว่าเกิดอะไรขึ้น เพราะนายอยู่ใน รพ. ไม่ได้สติ <<-->> You weren't here, you were in the hospital, unconscious. <<-->> similartity = 0.415732
Total =  31368

------

similarity > 0.420 and similarity <= 0.430
index=478: count=1: ก้าวขึ้นไปอ่าง 'มันไม่ได้เป็นไม่ มีความอับอายขายหน้า <<-->> Steр uр to the tub 'Tain't no disgraсe <<-->> similartity = 0.426928
index=814: count=2: สำหรับคุณคนเดียว <<-->> Onlу for you... <<-->> similartity = 0.424739
index=1171: count=3: เรียก การ์บริทซ มานี่ <<-->> Send Garbitsch here. <<-->> similartity = 0.429770
index=1184: count=4: ประชากรทำงานหนัก เขาต้องการความเห็นใจ <<-->> Nevertheless, the people are overworked. They need diversion. <<-->> similartity = 0.422361
index=1343: count=5: บาร์ม' จังหวะฮังการี <<-->> Brahms' Hungarian Dance number five. <<-->> similartity = 0.425423
index=1397: count=6: คุณเลวยิ่งกว่าโจร มันน่าเศร้าจริงๆ <<-->> Your policy is worse than a crime. It's a tragic blunder. <<-->> similartity = 0.428405
index=1427: count=7: ฉันช่วยไม่ได้ คำสั่งเป็นคำสั่ง <<-->> I can't help it. Schultz's orders. <<-->> similartity = 0.425507
index=1534: count=8: คุณทำอย่างนั้นไม่ได้ <<-->> You can't throw him out. <<-->> similartity = 0.425033
index=1550: count=9: สารวัตรทหาร <<-->> The storm troopers. <<-->> similartity = 0.425488
index=1663: count=10: ถ่ายรูปให้มันดีๆนะ ผู้นำสวะๆ ของเราอยากให้รูปออกมาดี <<-->> Tell the press to see that our Phooey is well photographed. <<-->> similartity = 0.425382
Total =  33477

------

similarity > 0.430 and similarity <= 0.440
index=238: count=1: มาสิ ชายไก่ ติดตามฉัน <<-->> Come on, hen... Men. Follow me. <<-->> similartity = 0.433389
index=607: count=2: คุณพระช่วย! <<-->> Oh, my goodness! <<-->> similartity = 0.436998
index=926: count=3: เป็นไปบ่ ได้ <<-->> Impossible. <<-->> similartity = 0.433314
index=1073: count=4: ทำร้ายเจ้าหน้าที่ <<-->> Attacking a storm trooper! <<-->> similartity = 0.432062
index=1188: count=5: ทำบางอย่างอาจจะเร้าใจกว่า เราพร้อมที่จะบุก ออสเตอริคไหม <<-->> Something more dramatic. When can we be ready to invade Osterlich? <<-->> similartity = 0.439919
index=1204: count=6: ฉันไม่เค้าใจเลย อยู่ๆชุมชนยิวก็สงบสุข <<-->> I don't understand it. The whole ghetto is so quiet. <<-->> similartity = 0.431710
index=1208: count=7: นายไม่ได้อยู่ดู สิ่งที่ดีที่สุดที่นายมี <<-->> You don't appreciate what a good time you were having. <<-->> similartity = 0.435460
index=1242: count=8: ตอนนี้ฉันกำลังมองหาสิ่งนั้นอยู่ <<-->> Things are looking brighter now. <<-->> similartity = 0.434091
index=1251: count=9: ทั้งบ๊องๆ <<-->> Both absent-minded. <<-->> similartity = 0.432706
index=1268: count=10: ล้มง่ายจัง <<-->> Take it easy there. <<-->> similartity = 0.439303
Total =  34633

------

similarity > 0.440 and similarity <= 0.450
index=92: count=1: ไปได้ <<-->> Now, go. <<-->> similartity = 0.443631
index=203: count=2: เฮ-โฮ, เฮ โฮ! เฮ-โฮ, เฮ-โฮ, เฮ โฮ! <<-->> Нeigh-ho, heigh-ho, heigh-ho Нeigh-ho, heigh-ho, heigh-ho... <<-->> similartity = 0.443192
index=594: count=3: บางวันเจ้าชายของฉันจะมา <<-->> Some daу mу рrince will come <<-->> similartity = 0.441611
index=677: count=4: ลาก่อน <<-->> Good-bye. <<-->> similartity = 0.449610
index=682: count=5: เพื่อวา <<-->> To wa... <<-->> similartity = 0.448531
index=698: count=6: บางวันเจ้าชายของฉันจะมา <<-->> Some daу mу рrince will come <<-->> similartity = 0.441611
index=738: count=7: ไปในการแก้ไข! <<-->> Get away! Go on, shoo! <<-->> similartity = 0.445552
index=851: count=8: พลปืนใหญ่ รวมพล <<-->> Muster the gun crew! <<-->> similartity = 0.445486
index=905: count=9: มันใกล้จะหมด <<-->> Almost empty. <<-->> similartity = 0.446045
index=969: count=10: เฮนเคิล ต้องอยู่กับเด็กๆ เป็นสนธิสัญญา ดับเบิล-คลอส <<-->> Hynkel's address to the children of the double-cross. <<-->> similartity = 0.443962
Total =  36856

------
lalital commented 4 years ago

The threshold that I selected is 0.400.

As a result, the number of sentence pairs filtered out is 493,923.

The remaining sentence pairs in the dataset (80/10/10 train/valid/test split):

th:

en: