Closed ghost closed 2 years ago
@tokyo-citizen ご指摘ありがとうございます!
✔については現状のままとする
こちらについては #1398 で反映されたとおりとなります。
-についてはマスターデータを修正する(8月7日時点でHYPHEN-MINUS/HORIZONTAL BAR/FULLWIDTH HYPHEN-MINUSが混在)
こちらは #2984 でコメント https://github.com/tokyo-metropolitan-gov/covid19/issues/2984#issuecomment-618157721 しましたが、現状では修正は難しい状況です。
残りにつきましては、翻訳チームに検討してもらうようにしますね。
@kaizumaki
こちらについては #1398 で反映されたとおりとなります。
慣例的に使われる場合もありますし、そもそもエンコーディングがUTF-8なので現状の 翻訳(en)のままが素直と思います。
こちらは #2984 でコメント #2984 (comment) しましたが、現状では修正は難しい状況です。
一般的にマスターデータに手を入れるのは難しい場合がありますし、auto-i18n/i18n_generator.py
の
ワークアラウンドで手を入れていることから空気は察しております!
ハイフン/ハイフンマイナス/ダッシュについて既にオフトピックのためあくまで参考情報です。 (生産的でないかもしれず申し訳ないです)
ハイフン/ハイフンマイナス/ダッシュの例外処理(現状)
-
HYPHEN-MINUS(U+002D)
‐
HYPHEN(U+2010)
―
HORIZONTAL BAR(U+2015)-
FULLWIDTH HYPHEN-MINUS(U+FF0D)以下は7月30日夜のデータ投入時における差分抜粋です。
--- a/data/data.json
+++ b/data/data.json
@@ -25183,7 +25205,7 @@
},
{
"リリース日": "2020-04-16T08:00:00.000Z",
- "居住地": null,
+ "居住地": "-",
"年代": "40代",
"性別": "女性",
"退院": "〇",
--- a/static/data/130001_tokyo_covid19_patients.csv
+++ b/static/data/130001_tokyo_covid19_patients.csv
@@ -2509,7 +2509,7 @@
2335,130001,東京都,,2020-04-15,水,,―,20代,女性,,,,,,1
2366,130001,東京都,,2020-04-15,水,,―,50代,女性,,,,,,1
2368,130001,東京都,,2020-04-15,水,,―,80代,女性,,,,,,1
-100082,130001,東京都,,2020-04-16,木,,"",40代,女性,,,,,,1
+100082,130001,東京都,,2020-04-16,木,,-,40代,女性,,,,,,1
2457,130001,東京都,,2020-04-16,木,,都外,20代,男性,,,,,,1
2523,130001,東京都,,2020-04-16,木,,都外,40代,男性,,,,,,1
100121,130001,東京都,,2020-04-16,木,,都外,40代,男性,,,,,,1
データにグリフが似ている文字が追加された(複数の人員での手入力あるある?)
-
FULLWIDTH HYPHEN-MINUS(U+FF0D)
なるほど。これはコンポーネントとスクリプト側でフォローせねばですね。
ちなみに、8月8日夜にマスターデータを変換して投入されたデータでは以下のようになっています。 (単純化するためCSVをネタにしています)
$ cut -d, -f8 static/data/130001_tokyo_covid19_patients.csv | sort | uniq
-
―
-
都内
都外
患者_居住地
調査中
湖北省武漢市
湖南省長沙市
$ cut -d, -f10 static/data/130001_tokyo_covid19_patients.csv | sort | uniq
-
―
不明
女性
男性
患者_性別
※
)・全角スペース(和字間隔)・全角ナンバーサインご指摘の通り修正するのが良いと思います。
文字コード関連について自分の知識があやふやなのですが、これらはHTMLでは本来 “
”
とマークアップされるもので、直接指定だと文字化けの可能性がある、という感じでしょうか? 特に強いこだわりは無いですが、可能であれば英語の曲線型の方が良いのかなと思っております。
「#7119」
こちらについては、語句の説明の際にどう表現するのが良いのか、他の言語の表記も含めて翻訳チームで再検討しようと思います(カギカッコ無しで #7119
を太字にする、など)
@MaySoMusician ご検討いただきありがとうございます。また、細かい話ばかりで申し訳ないです。
まず前提として、翻訳チームの皆様の思いを尊重させていただきます。
ご質問いただいた括弧系については、翻訳(en)のカタログファイルに既に以下のバリエーションが
あったので、"
:QUOTATION MARKに揃えるのはどうかなという主観的なものでした。
"
:QUOTATION MARK(U+0022)」'
:APOSTROPHE(U+0027)“”
LEFT DOUBLE QUOTATION MARK(U+201C)/RIGHT DOUBLE QUOTATION MARK)(U+201D)@MaySoMusician
エスケープするのか悩まなくていい“”
:LEFT DOUBLE QUOTATION MARK(U+201C)と
RIGHT DOUBLE QUOTATION MARK)(U+201D)がいい気がしてきました!
「#7119」
の部分は、カギカッコをとって太字にすることで翻訳チームと合意が取れたので #5260 を出しました
ハイフン問題 https://github.com/tokyo-metropolitan-gov/covid19/issues/5218#issuecomment-670844722 については、PR #5263 を出しました。
文字コード関連について自分の知識があやふやなのですが、これらはHTMLでは本来 “ ” とマークアップされるもので、
HTML 5/UTF-8で書かれていれば"&"(&)、"<"(<), ">"(>)以外は縛りはないはずですよ。
こちらのissueは解決済みと思われますので、クローズとします。
改善詳細 / Details of Improvement
スクリーンショット / Screenshot
以下のように確認しました
jq '.[]' assets/locales/en.json | hoge | LANG=C grep -v '^[[:cntrl:][:print:]]*$'
のような雰囲気で翻訳(en)を抽出しました※
(REFERENCE MARK) -->*
"※土・日・祝日を除く庁舎開庁日の1週間累計数": "※Cumulative of visitors to Tokyo Government Office Tower in public day (on weekdays)", "※死亡退院を含む": "※ including leaving hospital for passing away",“”
(LEFT DOUBLE QUOTATION MARK/RIGHT DOUBLE QUOTATION MARK) -->\"
"TOKYOおはようスクール": "TOKYO”OHAYO”SCHOOL", "退院等(療養期間経過を含む)": "“Discharged,etc.” (including recuperation period)", "東京アラート発動中": "A “Tokyo Alert” has been issued.", "東京アラート": "“Tokyo Alert”", "東京都では、都内の「感染状況」と「医療提供体制」を2つの柱として7つのモニタリング項目を設定しています。": "In the Tokyo Metropolitan Government, there are 7 items being monitored, based on the two core pillars of ”Infection Trends in Tokyo\" and ”Medical System Provisions”.", "感染状況・医療提供体制の分析": "Analysis of ”The Infection trends in Tokyo\" and ”Medical System Provisions”.",…
(HORIZONTAL ELLIPSIS) -->...
(?) "テレワーク・時差出勤などスムーズビズの取組は、新型コロナウイルス感染症の対策としても効果的です。感染症対策として、東京2020大会時の交通混雑緩和に向けた取組の前倒しをお願いします。": "\"Smooth Biz\" initiatives such as \"WFH\", \"Going to work later than usual\",etc…, are also effective against COVID-19. For preventing the spread of COVID-19, we need your help to take measures in advance of the Tokyo Olympic Games to avoid transportation congestion.",#
(FULLWIDTH NUMBER SIGN) -->#
"「#7119」:急病やけがの際に、緊急受診の必要性や診察可能な医療機関をアドバイスする電話相談窓口": "「#7119」: In case of sudden illness or injury, there is a telephone consultation service that advises both the necessity of emergency consultation, and on medical institutions that can examine such patients.",「」
(LEFT CORNER BRACKET/RIGHT CORNER BRACKET) -->\"
"「#7119」:急病やけがの際に、緊急受診の必要性や診察可能な医療機関をアドバイスする電話相談窓口": "「#7119」: In case of sudden illness or injury, there is a telephone consultation service that advises both the necessity of emergency consultation, and on medical institutions that can examine such patients.",✔
(HEAVY CHECK MARK) --> "Details of test positives"で利用(ASCIIにこだわると代案なく変更なしが妥当) "〇": "✔",-
(FULLWIDTH HYPHEN-MINUS) --> "Details of test positives"の4月16日に出現(マスターデータのダッシュ/ハイフン問題をクレンジングするのが妥当) "-": "-"期待する見せ方・挙動 / Expected behavior
✔
と-
を除く)✔
については現状のままとする-
についてはマスターデータを修正する(8月7日時点でHYPHEN-MINUS/HORIZONTAL BAR/FULLWIDTH HYPHEN-MINUSが混在)動作環境・ブラウザ / Environment