Closed pepapu closed 5 years ago
谢谢推荐,这个可以添加。
能提供一些典型的单词以及需要获取的部分么。我就照着爬了。
首先链接分日中和中日,应该分开处理比较好,word-details-pane-content
里有个data-from-lang="cn"
、data-from-lang="jp"
可以识别,中日可能不是很重要,我所知的话中翻日才用得上,网页中应该没这个需求。
发音 pronounces
pronounce-value-jp
有些词同一种读音也有可能多个音调(音调和读音是2个概念,有些词有多个读音,见下面例子3),比如https://www.hjdict.com/jp/jc/夜更かし音频 word-audio audio audio-light
其实没啥用,都是TTS生成的,日语的文字转语音效果很差,想知道怎么读一般都用forvo或者nhk发音词典
简单释义 simple
(蓝色背景的释义)这里我遇到过不是simple的时候
simple
里还可能有个simple-definition
,目前我没找到,似乎没了,可能改版过几次没了,我去年爬过后来格式稍微有些变化,但中译日还存在simple-definition
,比如:https://www.hjdict.com/jp/cj/我们详细释义 word-details-pane-content
例句 def-sentence-from
highlight
以及例句音频word-audio audio
例句解释 def-sentence-to
详细释义是源自《现代日汉双解词典》的情况 https://www.hjdict.com/jp/jc/鉢合わせ
有多个读音的日文汉字 https://www.hjdict.com/jp/jc/捻る
simple
是没有内容的 活用 https://www.hjdict.com/jp/jc/売ろう
详细释义中没有例句的情况:https://www.hjdict.com/jp/jc/酢昆布
例句格式比较混乱,这个多个读音的词可以体现这种情况,第一个读音引用自《现代日汉双解词典》的例句有完整序号等,第二个读音没有引用就是另一种格式。(对于后者的情况我的理解是没有引用《现代日汉双解词典》的其实就是simple
蓝色背景里用的词典的例句。) https://www.hjdict.com/jp/jc/係
simple
蓝色背景框没释义,详细释义里有内容的情况 https://www.hjdict.com/jp/jc/贔屓
英语或其他欧美语言演化过来的外来词,详细释义中可能会有tags-word
后面跟着原词,比如 [PET(polyethylene terephthalate) bottle] ,https://www.hjdict.com/jp/jc/ペットボトル 、 https://www.hjdict.com/jp/jc/プロポーション
tags-word
(所以说格式有点混乱)https://www.hjdict.com/jp/jc/ピンセット暂时能提供这些信息,有bug再修正好了。
那要不我整个一起抓好了,我看了这些例子都是上部蓝色部分以及下部的“详细释义”两块。多音字还有顶部多选。
中日价值不大那只实现日中吧。
或者默认日中,我再提供个中日的按钮。我看排版都是一样。
我觉得没必要,实现起来简单的话也无妨。提供按钮是个不错的方法。
还有一种情况是查不到的词有些会出现建议选项 比如 https://www.hjdict.com/jp/jc/磨りガラ 会跳转成 https://www.hjdict.com/notfound/jp/jc/磨りガラ
可以把建议选项 放在查询结果里,点击跳转到词典网页或者应用内查词
嗯,这个会加上去
看到#156 可以使用weblio的词典了,希望也能添加一些中日词典。
https://www.hjdict.com/ 沪江日语词典是目前最好的日中词典, 平时难度高一点的词汇一般都直接查日日词典和google,都不会去查日中词典, 但沪江的在线日语词典却可以做到和日日词典互补程度的好用,完全超越了以往对日中词典的印象。 (甚至连活用都能查,虽然目前沙拉内置的weblio也能查活用,“活用”指的是日语词形变化相关的语法名词) 沪江app上的api有加密,只能手动爬。 同时这个词典其实是2本词典,有时候没有中文释义的词沪江会直接日日词典的解释(这是这本词典的另一个厉害的地方)。蓝色背景和底下详细释义要爬的话应该同时获取,模板稍微有点混乱,还得多找几个词测试。 详细释义有些是《现代日汉双解词典》里的解释(和外教社合作)
同时建议weblio的日中词典https://cjjc.weblio.jp/也可以放入。