Bartelds commited on
Commit
beccc85
·
1 Parent(s): 3f6a74e

Upload checkpoint, sanitized config, and transcripts for ctc-baseline_mms_set_5

Browse files
Files changed (5) hide show
  1. README.md +41 -0
  2. config.yaml +1420 -0
  3. hyp.trn +0 -0
  4. ref.trn +0 -0
  5. valid.loss.best.pth +3 -0
README.md ADDED
@@ -0,0 +1,41 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ ---
2
+ title: "CTC-DRO MMS-based ASR model - set 5"
3
+ language: multilingual
4
+ tags:
5
+ - asr
6
+ - ctc-dro
7
+ - MMS
8
+ license: cc-by-nc-4.0
9
+ ---
10
+
11
+ # CTC-Baseline MMS-based ASR model - set 5
12
+
13
+ This repository contains a CTC-Baseline MMS-based automatic speech recognition (ASR) model trained with ESPnet.
14
+ The model was trained on balanced training data from set 5.
15
+
16
+ ## Intended Use
17
+
18
+ This model is intended for ASR. Users can run inference using the provided checkpoint (`valid.loss.best.pth`) and configuration file (`config.yaml`):
19
+ ```bash
20
+ import soundfile as sf
21
+ from espnet2.bin.asr_inference import Speech2Text
22
+
23
+ asr_train_config = "ctc-baseline_mms_set_5/config.yaml"
24
+ asr_model_file = "ctc-baseline_mms_set_5/valid.loss.best.pth"
25
+
26
+ model = Speech2Text.from_pretrained(
27
+ asr_train_config=asr_train_config,
28
+ asr_model_file=asr_model_file
29
+ )
30
+
31
+ speech, _ = sf.read("input.wav")
32
+ text, *_ = model(speech)[0]
33
+
34
+ print("Recognized text:", text)
35
+ ```
36
+
37
+ ## How to Use
38
+
39
+ 1. Clone this repository.
40
+ 2. Use ESPnet’s inference scripts with the provided `config.yaml` and checkpoint file.
41
+ 3. Ensure any external resources referenced in `config.yaml` are available at the indicated relative paths.
config.yaml ADDED
@@ -0,0 +1,1420 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ accum_grad: 16
2
+ adapter: lora
3
+ adapter_conf: {}
4
+ allow_multi_rates: false
5
+ allow_variable_data_keys: false
6
+ aux_ctc_tasks: []
7
+ batch_bins: 1000000
8
+ batch_size: 4
9
+ batch_type: duration_language
10
+ best_model_criterion:
11
+ - - valid
12
+ - loss
13
+ - min
14
+ bpemodel: null
15
+ chunk_default_fs: null
16
+ chunk_excluded_key_prefixes: []
17
+ chunk_length: 500
18
+ chunk_shift_ratio: 0.5
19
+ cleaner: null
20
+ collect_stats: false
21
+ create_graph_in_tensorboard: false
22
+ ctc_conf:
23
+ ctc_type: builtin
24
+ cudnn_benchmark: false
25
+ cudnn_deterministic: true
26
+ cudnn_enabled: true
27
+ decoder: null
28
+ decoder_conf: {}
29
+ detect_anomaly: false
30
+ distributed: false
31
+ drop_last_iter: false
32
+ dry_run: false
33
+ duration_batch_length: -1
34
+ early_stopping_criterion:
35
+ - valid
36
+ - loss
37
+ - min
38
+ encoder: transformer
39
+ encoder_conf:
40
+ attention_dropout_rate: 0.1
41
+ attention_heads: 8
42
+ dropout_rate: 0.1
43
+ input_layer: conv2d2
44
+ linear_units: 1024
45
+ normalize_before: true
46
+ num_blocks: 2
47
+ output_size: 256
48
+ positional_dropout_rate: 0.1
49
+ exclude_weight_decay: false
50
+ exclude_weight_decay_conf: {}
51
+ fold_length:
52
+ - 80000
53
+ - 150
54
+ freeze_param: []
55
+ frontend: s3prl
56
+ frontend_conf:
57
+ download_dir: ./hub
58
+ frontend_conf:
59
+ path_or_url: facebook/mms-300m
60
+ upstream: hf_wav2vec2_custom
61
+ fs: 16k
62
+ multilayer_feature: true
63
+ g2p: null
64
+ grad_clip: 5.0
65
+ grad_clip_type: 2.0
66
+ grad_noise: false
67
+ ignore_init_mismatch: false
68
+ init: xavier_uniform
69
+ init_param: []
70
+ input_size: null
71
+ iterator_type: sequence
72
+ joint_net_conf: null
73
+ keep_nbest_models: 5
74
+ log_interval: null
75
+ log_level: INFO
76
+ max_cache_fd: 32
77
+ max_cache_size: 0.0
78
+ max_epoch: 40
79
+ model: espnet
80
+ model_conf:
81
+ ctc_weight: 1.0
82
+ multiple_iterator: false
83
+ multiprocessing_distributed: false
84
+ nbest_averaging_interval: 0
85
+ ngpu: 1
86
+ no_forward_run: false
87
+ noise_apply_prob: 1.0
88
+ noise_db_range: '13_15'
89
+ noise_scp: null
90
+ non_linguistic_symbols: ./nlsyms.txt
91
+ normalize: utterance_mvn
92
+ normalize_conf: {}
93
+ num_att_plot: 3
94
+ num_cache_chunks: 1024
95
+ num_iters_per_epoch: 1200
96
+ num_workers: 4
97
+ optim: adam
98
+ optim_conf:
99
+ lr: 0.0001
100
+ weight_decay: 1.0e-06
101
+ output_dir: ./inference_results
102
+ patience: null
103
+ postencoder: null
104
+ postencoder_conf: {}
105
+ preencoder: linear
106
+ preencoder_conf:
107
+ input_size: 1024
108
+ output_size: 80
109
+ preprocessor: default
110
+ preprocessor_conf: {}
111
+ pretrain_path: null
112
+ print_config: false
113
+ required:
114
+ - output_dir
115
+ - token_list
116
+ resume: true
117
+ rir_apply_prob: 1.0
118
+ rir_scp: null
119
+ save_strategy: all
120
+ scheduler: null
121
+ scheduler_conf: {}
122
+ seed: 0
123
+ sharded_ddp: false
124
+ short_noise_thres: 0.5
125
+ shuffle_within_batch: false
126
+ sort_batch: descending
127
+ sort_in_batch: descending
128
+ specaug: specaug
129
+ specaug_conf:
130
+ apply_freq_mask: true
131
+ apply_time_mask: true
132
+ apply_time_warp: true
133
+ freq_mask_width_range:
134
+ - 0
135
+ - 27
136
+ num_freq_mask: 2
137
+ num_time_mask: 10
138
+ time_mask_width_ratio_range:
139
+ - 0.0
140
+ - 0.05
141
+ time_warp_mode: bicubic
142
+ time_warp_window: 5
143
+ speech_volume_normalize: null
144
+ token_list:
145
+ - <blank>
146
+ - <unk>
147
+ - <space>
148
+ - E
149
+ - A
150
+ - N
151
+ - I
152
+ - S
153
+ - R
154
+ - T
155
+ - O
156
+ - D
157
+ - L
158
+ - О
159
+ - H
160
+ - U
161
+ - C
162
+ - י
163
+ - ו
164
+ - Е
165
+ - И
166
+ - А
167
+ - M
168
+ - Н
169
+ - Т
170
+ - ה
171
+ - G
172
+ - С
173
+ - ל
174
+ - P
175
+ - Р
176
+ - В
177
+ - B
178
+ - מ
179
+ - ת
180
+ - ר
181
+ - Л
182
+ - F
183
+ - ב
184
+ - W
185
+ - א
186
+ - ש
187
+ - М
188
+ - К
189
+ - Д
190
+ - נ
191
+ - V
192
+ - ם
193
+ - П
194
+ - Y
195
+ - Я
196
+ - У
197
+ - '[deu]'
198
+ - ע
199
+ - Ы
200
+ - '[eng]'
201
+ - K
202
+ - ד
203
+ - ח
204
+ - ק
205
+ - Г
206
+ - כ
207
+ - פ
208
+ - の
209
+ - Б
210
+ - З
211
+ - ס
212
+ - Ь
213
+ - Ч
214
+ - Z
215
+ - ג
216
+ - し
217
+ - に
218
+ - ט
219
+ - Й
220
+ - は
221
+ - '[heb]'
222
+ - Q
223
+ - で
224
+ - Ж
225
+ - Х
226
+ - た
227
+ - '[rus]'
228
+ - צ
229
+ - '[spa]'
230
+ - ま
231
+ - Ó
232
+ - '[jpn]'
233
+ - Ю
234
+ - す
235
+ - る
236
+ - を
237
+ - い
238
+ - ן
239
+ - '0'
240
+ - と
241
+ - が
242
+ - ז
243
+ - J
244
+ - て
245
+ - Í
246
+ - れ
247
+ - Ш
248
+ - '1'
249
+ - ン
250
+ - Ü
251
+ - Ц
252
+ - な
253
+ - Ä
254
+ - Á
255
+ - ー
256
+ - り
257
+ - こ
258
+ - Щ
259
+ - Ф
260
+ - '2'
261
+ - X
262
+ - Э
263
+ - さ
264
+ - か
265
+ - あ
266
+ - ス
267
+ - É
268
+ - ル
269
+ - ך
270
+ - も
271
+ - う
272
+ - ら
273
+ - ア
274
+ - Ö
275
+ - く
276
+ - っ
277
+ - イ
278
+ - よ
279
+ - ト
280
+ - '6'
281
+ - ラ
282
+ - き
283
+ - 人
284
+ - ん
285
+ - Ё
286
+ - ף
287
+ - '3'
288
+ - '5'
289
+ - け
290
+ - '9'
291
+ - ッ
292
+ - リ
293
+ - ド
294
+ - '4'
295
+ - や
296
+ - そ
297
+ - ロ
298
+ - 国
299
+ - 地
300
+ - Ñ
301
+ - '8'
302
+ - せ
303
+ - 的
304
+ - シ
305
+ - め
306
+ - タ
307
+ - カ
308
+ - 日
309
+ - つ
310
+ - ジ
311
+ - Ú
312
+ - ク
313
+ - フ
314
+ - 発
315
+ - ャ
316
+ - テ
317
+ - え
318
+ - 場
319
+ - «
320
+ - '7'
321
+ - 合
322
+ - ば
323
+ - ど
324
+ - »
325
+ - 行
326
+ - 上
327
+ - 大
328
+ - コ
329
+ - 間
330
+ - ち
331
+ - 生
332
+ - 年
333
+ - 物
334
+ - 一
335
+ - 動
336
+ - 者
337
+ - オ
338
+ - わ
339
+ - ץ
340
+ - 時
341
+ - 法
342
+ - だ
343
+ - 中
344
+ - バ
345
+ - 方
346
+ - 要
347
+ - 前
348
+ - サ
349
+ - チ
350
+ - ウ
351
+ - 会
352
+ - ブ
353
+ - べ
354
+ - レ
355
+ - ィ
356
+ - 月
357
+ - 手
358
+ - 告
359
+ - 分
360
+ - 定
361
+ - プ
362
+ - ネ
363
+ - ニ
364
+ - 以
365
+ - 彼
366
+ - 常
367
+ - 最
368
+ - 部
369
+ - 性
370
+ - 事
371
+ - 後
372
+ - グ
373
+ - 多
374
+ - 報
375
+ - 見
376
+ - 学
377
+ - ほ
378
+ - 可
379
+ - ェ
380
+ - 用
381
+ - パ
382
+ - み
383
+ - お
384
+ - ュ
385
+ - メ
386
+ - 体
387
+ - 立
388
+ - 通
389
+ - 入
390
+ - 理
391
+ - ょ
392
+ - ム
393
+ - 能
394
+ - 出
395
+ - デ
396
+ - 成
397
+ - 下
398
+ - キ
399
+ - 金
400
+ - マ
401
+ - 示
402
+ - 必
403
+ - 所
404
+ - 力
405
+ - エ
406
+ - セ
407
+ - 他
408
+ - 子
409
+ - 同
410
+ - ズ
411
+ - ピ
412
+ - 選
413
+ - 点
414
+ - 語
415
+ - 化
416
+ - ケ
417
+ - ナ
418
+ - 長
419
+ - 高
420
+ - 新
421
+ - Ъ
422
+ - ビ
423
+ - ガ
424
+ - 先
425
+ - 表
426
+ - 関
427
+ - ず
428
+ - 当
429
+ - ツ
430
+ - 電
431
+ - 明
432
+ - 機
433
+ - 過
434
+ - 集
435
+ - 世
436
+ - 期
437
+ - 使
438
+ - 結
439
+ - 観
440
+ - 在
441
+ - 内
442
+ - 数
443
+ - 種
444
+ - 問
445
+ - 計
446
+ - 度
447
+ - 光
448
+ - 氏
449
+ - 曜
450
+ - 験
451
+ - 議
452
+ - げ
453
+ - 面
454
+ - 持
455
+ - 実
456
+ - 空
457
+ - 自
458
+ - 気
459
+ - ダ
460
+ - 試
461
+ - 開
462
+ - 形
463
+ - 業
464
+ - 際
465
+ - 変
466
+ - 非
467
+ - 考
468
+ - ���
469
+ - 全
470
+ - 話
471
+ - 調
472
+ - 件
473
+ - 流
474
+ - ミ
475
+ - 主
476
+ - 特
477
+ - 住
478
+ - 族
479
+ - 予
480
+ - 教
481
+ - 活
482
+ - ョ
483
+ - 向
484
+ - 異
485
+ - 決
486
+ - 供
487
+ - 言
488
+ - 院
489
+ - 文
490
+ - 死
491
+ - 対
492
+ - じ
493
+ - 正
494
+ - 現
495
+ - 作
496
+ - ろ
497
+ - 述
498
+ - 題
499
+ - 外
500
+ - 球
501
+ - 意
502
+ - ハ
503
+ - 名
504
+ - 民
505
+ - 州
506
+ - 米
507
+ - 画
508
+ - ホ
509
+ - 軍
510
+ - ボ
511
+ - 始
512
+ - 重
513
+ - 水
514
+ - 陸
515
+ - 書
516
+ - 界
517
+ - 記
518
+ - 何
519
+ - 戦
520
+ - ギ
521
+ - 員
522
+ - 離
523
+ - 食
524
+ - 約
525
+ - 状
526
+ - 番
527
+ - 組
528
+ - 得
529
+ - 経
530
+ - ペ
531
+ - 島
532
+ - 設
533
+ - ゴ
534
+ - 々
535
+ - 目
536
+ - 知
537
+ - 果
538
+ - 社
539
+ - 本
540
+ - 受
541
+ - 制
542
+ - 影
543
+ - 小
544
+ - へ
545
+ - ポ
546
+ - 旅
547
+ - 位
548
+ - 車
549
+ - 私
550
+ - 故
551
+ - 火
552
+ - 去
553
+ - 提
554
+ - 質
555
+ - 不
556
+ - 認
557
+ - 航
558
+ - 宿
559
+ - ソ
560
+ - 北
561
+ - 起
562
+ - 研
563
+ - 価
564
+ - 児
565
+ - 身
566
+ - 第
567
+ - 式
568
+ - 府
569
+ - 家
570
+ - 初
571
+ - 音
572
+ - 連
573
+ - 例
574
+ - 録
575
+ - 近
576
+ - 違
577
+ - 利
578
+ - 訪
579
+ - 型
580
+ - 星
581
+ - 念
582
+ - 今
583
+ - 限
584
+ - 陽
585
+ - ザ
586
+ - ベ
587
+ - む
588
+ - 広
589
+ - ァ
590
+ - 確
591
+ - ヴ
592
+ - 来
593
+ - 呼
594
+ - 収
595
+ - 泊
596
+ - 施
597
+ - 激
598
+ - 降
599
+ - 育
600
+ - 係
601
+ - 切
602
+ - 山
603
+ - 止
604
+ - 究
605
+ - 加
606
+ - 任
607
+ - 監
608
+ - 原
609
+ - 因
610
+ - 強
611
+ - 政
612
+ - 路
613
+ - 規
614
+ - 税
615
+ - 建
616
+ - 客
617
+ - 相
618
+ - 判
619
+ - 険
620
+ - 張
621
+ - モ
622
+ - 応
623
+ - 査
624
+ - 王
625
+ - 元
626
+ - 続
627
+ - ゲ
628
+ - ヨ
629
+ - び
630
+ - 感
631
+ - ヒ
632
+ - 類
633
+ - 存
634
+ - 投
635
+ - 局
636
+ - 、
637
+ - 症
638
+ - 再
639
+ - 料
640
+ - 安
641
+ - 太
642
+ - 味
643
+ - 量
644
+ - 情
645
+ - 務
646
+ - 抗
647
+ - 有
648
+ - ォ
649
+ - 海
650
+ - 由
651
+ - 英
652
+ - 撃
653
+ - 評
654
+ - 協
655
+ - 野
656
+ - 親
657
+ - 放
658
+ - 害
659
+ - 検
660
+ - 更
661
+ - 登
662
+ - 基
663
+ - 神
664
+ - 公
665
+ - 難
666
+ - 指
667
+ - 保
668
+ - 震
669
+ - 台
670
+ - 領
671
+ - 暴
672
+ - 付
673
+ - 回
674
+ - 科
675
+ - 送
676
+ - 直
677
+ - 与
678
+ - 帰
679
+ - 視
680
+ - 両
681
+ - 握
682
+ - 歩
683
+ - 天
684
+ - 心
685
+ - 参
686
+ - 響
687
+ - 楽
688
+ - 産
689
+ - 婚
690
+ - 属
691
+ - 医
692
+ - 速
693
+ - 細
694
+ - 準
695
+ - ־
696
+ - 史
697
+ - 済
698
+ - 障
699
+ - 軽
700
+ - 側
701
+ - 悪
702
+ - 工
703
+ - 習
704
+ - ノ
705
+ - 権
706
+ - 戻
707
+ - 申
708
+ - 遺
709
+ - 唆
710
+ - 被
711
+ - 交
712
+ - 況
713
+ - ユ
714
+ - 訴
715
+ - ワ
716
+ - 割
717
+ - 否
718
+ - 融
719
+ - 信
720
+ - 二
721
+ - 除
722
+ - 様
723
+ - ぐ
724
+ - 殿
725
+ - 運
726
+ - 演
727
+ - 余
728
+ - 解
729
+ - 道
730
+ - 病
731
+ - 低
732
+ - ぎ
733
+ - 代
734
+ - 週
735
+ - 市
736
+ - ヘ
737
+ - 比
738
+ - 資
739
+ - 庭
740
+ - 統
741
+ - 残
742
+ - 適
743
+ - 首
744
+ - 撮
745
+ - 望
746
+ - 遠
747
+ - 別
748
+ - 案
749
+ - 売
750
+ - 誌
751
+ - 術
752
+ - 急
753
+ - 着
754
+ - 委
755
+ - 支
756
+ - 優
757
+ - 写
758
+ - 落
759
+ - 港
760
+ - 傾
761
+ - 置
762
+ - 夫
763
+ - 乗
764
+ - 亡
765
+ - 系
766
+ - 殺
767
+ - 識
768
+ - 欠
769
+ - 素
770
+ - 挙
771
+ - 周
772
+ - 共
773
+ - 療
774
+ - 端
775
+ - 捕
776
+ - 染
777
+ - 司
778
+ - 潜
779
+ - 歴
780
+ - 品
781
+ - 買
782
+ - 択
783
+ - 肢
784
+ - 眺
785
+ - 態
786
+ - 良
787
+ - 源
788
+ - 繰
789
+ - 伝
790
+ - 雨
791
+ - 季
792
+ - 込
793
+ - 律
794
+ - ヌ
795
+ - 紀
796
+ - 征
797
+ - 服
798
+ - 諸
799
+ - 求
800
+ - 延
801
+ - 倒
802
+ - 突
803
+ - 午
804
+ - 頃
805
+ - 東
806
+ - ゆ
807
+ - 映
808
+ - 証
809
+ - 改
810
+ - ざ
811
+ - 伸
812
+ - 無
813
+ - 増
814
+ - 攻
815
+ - 察
816
+ - 隊
817
+ - 群
818
+ - 管
819
+ - 苦
820
+ - 禁
821
+ - 換
822
+ - 葉
823
+ - 模
824
+ - 率
825
+ - 課
826
+ - 区
827
+ - ぞ
828
+ - 営
829
+ - ご
830
+ - 取
831
+ - 致
832
+ - 幅
833
+ - 触
834
+ - 号
835
+ - 説
836
+ - 導
837
+ - 鳥
838
+ - 備
839
+ - 象
840
+ - 便
841
+ - 較
842
+ - 女
843
+ - 寒
844
+ - 温
845
+ - 岸
846
+ - 荷
847
+ - 敗
848
+ - 飛
849
+ - 衆
850
+ - 足
851
+ - 接
852
+ - 単
853
+ - 進
854
+ - 争
855
+ - 覚
856
+ - 獲
857
+ - 十
858
+ - 省
859
+ - 把
860
+ - 微
861
+ - 暖
862
+ - 焦
863
+ - 囲
864
+ - 雑
865
+ - 独
866
+ - 配
867
+ - 校
868
+ - 早
869
+ - 南
870
+ - 満
871
+ - 濃
872
+ - ゥ
873
+ - 町
874
+ - 論
875
+ - 刑
876
+ - 票
877
+ - 波
878
+ - 裁
879
+ - 歌
880
+ - 扱
881
+ - 少
882
+ - 菌
883
+ - 終
884
+ - 真
885
+ - 刻
886
+ - 逮
887
+ - 土
888
+ - 般
889
+ - 懸
890
+ - 党
891
+ - 断
892
+ - 傷
893
+ - 負
894
+ - 氷
895
+ - 厚
896
+ - 漁
897
+ - 師
898
+ - 消
899
+ - 酸
900
+ - 著
901
+ - ぼ
902
+ - 巨
903
+ - 図
904
+ - 券
905
+ - 館
906
+ - 爆
907
+ - 警
908
+ - 圏
909
+ - 跡
910
+ - 拠
911
+ - 紙
912
+ - 雲
913
+ - 将
914
+ - 援
915
+ - 猫
916
+ - 移
917
+ - 処
918
+ - 責
919
+ - づ
920
+ - 拒
921
+ - 効
922
+ - 頼
923
+ - 密
924
+ - 閉
925
+ - 購
926
+ - 容
927
+ - 削
928
+ - 欧
929
+ - 防
930
+ - 盟
931
+ - 折
932
+ - 専
933
+ - 門
934
+ - 極
935
+ - 到
936
+ - 達
937
+ - 聞
938
+ - 摘
939
+ - 紛
940
+ - 竜
941
+ - 巻
942
+ - 室
943
+ - 許
944
+ - 承
945
+ - 請
946
+ - 弓
947
+ - 弟
948
+ - 頻
949
+ - 疲
950
+ - 古
951
+ - 庁
952
+ - 反
953
+ - 官
954
+ - 境
955
+ - 勢
956
+ - 母
957
+ - 販
958
+ - 歳
959
+ - 義
960
+ - 河
961
+ - 口
962
+ - 革
963
+ - 命
964
+ - 抑
965
+ - 圧
966
+ - 各
967
+ - 木
968
+ - 技
969
+ - 構
970
+ - 造
971
+ - 競
972
+ - 復
973
+ - 緊
974
+ - ぶ
975
+ - 製
976
+ - 商
977
+ - 絶
978
+ - 失
979
+ - 覆
980
+ - 廃
981
+ - 祖
982
+ - 催
983
+ - 痛
984
+ - 快
985
+ - 益
986
+ - 侵
987
+ - 墜
988
+ - 徴
989
+ - 斜
990
+ - 美
991
+ - 魅
992
+ - 了
993
+ - 器
994
+ - 干
995
+ - 然
996
+ - 測
997
+ - 距
998
+ - 婦
999
+ - 祝
1000
+ - 村
1001
+ - 次
1002
+ - 読
1003
+ - 敷
1004
+ - 厳
1005
+ - 胎
1006
+ - 肺
1007
+ - 熟
1008
+ - 印
1009
+ - 刷
1010
+ - 滞
1011
+ - 洋
1012
+ - 昨
1013
+ - 功
1014
+ - 驚
1015
+ - 右
1016
+ - 左
1017
+ - 訛
1018
+ - 郷
1019
+ - 貧
1020
+ - 惑
1021
+ - 華
1022
+ - 総
1023
+ - 矛
1024
+ - 盾
1025
+ - 頂
1026
+ - 洞
1027
+ - 窟
1028
+ - 辞
1029
+ - 思
1030
+ - 推
1031
+ - 衛
1032
+ - 兵
1033
+ - 振
1034
+ - 担
1035
+ - 渡
1036
+ - 患
1037
+ - 団
1038
+ - ヤ
1039
+ - 皆
1040
+ - 還
1041
+ - 船
1042
+ - 鏡
1043
+ - 胞
1044
+ - 照
1045
+ - 億
1046
+ - 釈
1047
+ - 犬
1048
+ - 罪
1049
+ - 帝
1050
+ - 転
1051
+ - ×
1052
+ - 夜
1053
+ - 採
1054
+ - 具
1055
+ - 深
1056
+ - 千
1057
+ - 布
1058
+ - 危
1059
+ - 襲
1060
+ - 宅
1061
+ - 免
1062
+ - 疫
1063
+ - 為
1064
+ - 芸
1065
+ - 勧
1066
+ - 固
1067
+ - 像
1068
+ - 届
1069
+ - 怪
1070
+ - 我
1071
+ - 標
1072
+ - 半
1073
+ - 沿
1074
+ - 声
1075
+ - 朝
1076
+ - 礁
1077
+ - 「
1078
+ - 」
1079
+ - 崩
1080
+ - 枚
1081
+ - 引
1082
+ - —
1083
+ - 熱
1084
+ - 災
1085
+ - 玉
1086
+ - 卵
1087
+ - 須
1088
+ - 含
1089
+ - 涙
1090
+ - 乾
1091
+ - 超
1092
+ - 湖
1093
+ - 西
1094
+ - 誕
1095
+ - 渉
1096
+ - 拾
1097
+ - 囚
1098
+ - 陥
1099
+ - 派
1100
+ - 待
1101
+ - 久
1102
+ - 麓
1103
+ - 暗
1104
+ - 敵
1105
+ - 阻
1106
+ - 駐
1107
+ - 屯
1108
+ - 添
1109
+ - 尿
1110
+ - 晶
1111
+ - 列
1112
+ - 巣
1113
+ - 懲
1114
+ - 戒
1115
+ - 績
1116
+ - 善
1117
+ - 互
1118
+ - 棄
1119
+ - 注
1120
+ - 借
1121
+ - 啓
1122
+ - 蒙
1123
+ - 差
1124
+ - 討
1125
+ - 維
1126
+ - 仕
1127
+ - 翌
1128
+ - 裕
1129
+ - 役
1130
+ - 嵐
1131
+ - 漏
1132
+ - 斗
1133
+ - 渦
1134
+ - 個
1135
+ - 誘
1136
+ - 晰
1137
+ - 夢
1138
+ - 繁
1139
+ - 弊
1140
+ - 七
1141
+ - 格
1142
+ - 索
1143
+ - 店
1144
+ - 街
1145
+ - 屋
1146
+ - 築
1147
+ - 石
1148
+ - 洪
1149
+ - 臆
1150
+ - 環
1151
+ - 冷
1152
+ - 貼
1153
+ - 未
1154
+ - 罰
1155
+ - 貿
1156
+ - 易
1157
+ - 従
1158
+ - 息
1159
+ - 貨
1160
+ - 労
1161
+ - 働
1162
+ - 階
1163
+ - 級
1164
+ - 刺
1165
+ - 頭
1166
+ - 脳
1167
+ - 喜
1168
+ - 策
1169
+ - 傘
1170
+ - 羽
1171
+ - 毛
1172
+ - 血
1173
+ - 猛
1174
+ - 禽
1175
+ - 爪
1176
+ - 遅
1177
+ - 博
1178
+ - 希
1179
+ - 薄
1180
+ - 慣
1181
+ - 避
1182
+ - 慢
1183
+ - 疼
1184
+ - 窃
1185
+ - 盗
1186
+ - 乞
1187
+ - 搾
1188
+ - 契
1189
+ - 絡
1190
+ - 滑
1191
+ - 走
1192
+ - 鎖
1193
+ - 値
1194
+ - 飲
1195
+ - 風
1196
+ - 凝
1197
+ - 窓
1198
+ - 若
1199
+ - 殊
1200
+ - 妙
1201
+ - 鍵
1202
+ - 盤
1203
+ - 叩
1204
+ - 屠
1205
+ - 節
1206
+ - 衣
1207
+ - 範
1208
+ - 複
1209
+ - 友
1210
+ - 戚
1211
+ - 完
1212
+ - 吸
1213
+ - 闘
1214
+ - 材
1215
+ - 勉
1216
+ - 好
1217
+ - 句
1218
+ - 章
1219
+ - 座
1220
+ - 席
1221
+ - 覧
1222
+ - 掲
1223
+ - 載
1224
+ - 破
1225
+ - 綻
1226
+ - 扉
1227
+ - 平
1228
+ - 央
1229
+ - 簡
1230
+ - 挫
1231
+ - 条
1232
+ - 至
1233
+ - 返
1234
+ - 署
1235
+ - 批
1236
+ - 准
1237
+ - 裏
1238
+ - 鳴
1239
+ - 磁
1240
+ - 憲
1241
+ - 答
1242
+ - 井
1243
+ - 狭
1244
+ - 退
1245
+ - 字
1246
+ - 訓
1247
+ - 秀
1248
+ - 魚
1249
+ - 毒
1250
+ - 恐
1251
+ - 怖
1252
+ - 怯
1253
+ - 妃
1254
+ - 徒
1255
+ - 宮
1256
+ - 修
1257
+ - 齢
1258
+ - 童
1259
+ - 肝
1260
+ - 胆
1261
+ - 癌
1262
+ - 欲
1263
+ - 宇
1264
+ - 宙
1265
+ - 混
1266
+ - 赤
1267
+ - 潮
1268
+ - 候
1269
+ - 薬
1270
+ - 治
1271
+ - 遂
1272
+ - 晴
1273
+ - 憾
1274
+ - 飼
1275
+ - 犯
1276
+ - 嫌
1277
+ - 荒
1278
+ - ゃ
1279
+ - 横
1280
+ - 越
1281
+ - 披
1282
+ - 露
1283
+ - 狩
1284
+ - 猟
1285
+ - 背
1286
+ - 景
1287
+ - 鉛
1288
+ - 筆
1289
+ - 途
1290
+ - 豚
1291
+ - 蚊
1292
+ - 帳
1293
+ - 虫
1294
+ - 剤
1295
+ - 散
1296
+ - 措
1297
+ - 賞
1298
+ - 該
1299
+ - 賊
1300
+ - 狂
1301
+ - 逃
1302
+ - 滝
1303
+ - 昼
1304
+ - 涼
1305
+ - 執
1306
+ - 万
1307
+ - 称
1308
+ - 補
1309
+ - 助
1310
+ - 駆
1311
+ - 射
1312
+ - 粒
1313
+ - 誰
1314
+ - 卒
1315
+ - 額
1316
+ - 寄
1317
+ - 幼
1318
+ - 揃
1319
+ - 想
1320
+ - 継
1321
+ - 皇
1322
+ - 募
1323
+ - 尾
1324
+ - 花
1325
+ - 沢
1326
+ - 郵
1327
+ - 恒
1328
+ - 賀
1329
+ - 銃
1330
+ - 妻
1331
+ - 瓶
1332
+ - 守
1333
+ - 棒
1334
+ - 織
1335
+ - 艦
1336
+ - 富
1337
+ - 困
1338
+ - 減
1339
+ - 則
1340
+ - 園
1341
+ - 訳
1342
+ - 追
1343
+ - 末
1344
+ - 核
1345
+ - 炉
1346
+ - 鹿
1347
+ - 譲
1348
+ - ふ
1349
+ - 耐
1350
+ - 和
1351
+ - 勝
1352
+ - 香
1353
+ - 都
1354
+ - 拓
1355
+ - 1
1356
+ - 亜
1357
+ - 三
1358
+ - 怒
1359
+ - 豪
1360
+ - 稀
1361
+ - 是
1362
+ - 聖
1363
+ - 壊
1364
+ - ゾ
1365
+ - 墟
1366
+ - 塞
1367
+ - 仏
1368
+ - 寺
1369
+ - 網
1370
+ - 算
1371
+ - 唸
1372
+ - 士
1373
+ - 整
1374
+ - ひ
1375
+ - 孫
1376
+ - 馳
1377
+ - 診
1378
+ - 円
1379
+ - 搬
1380
+ - 里
1381
+ - 需
1382
+ - 福
1383
+ - 祉
1384
+ - 阪
1385
+ - 塊
1386
+ - 唱
1387
+ - 聴
1388
+ - 迅
1389
+ - 疑
1390
+ - 依
1391
+ - 謝
1392
+ - 財
1393
+ - 臣
1394
+ - 就
1395
+ - 籍
1396
+ - –
1397
+ - ¿
1398
+ - º
1399
+ - ¡
1400
+ - <sos/eos>
1401
+ token_type: char
1402
+ train_dtype: float32
1403
+ unused_parameters: true
1404
+ use_adapter: false
1405
+ use_amp: false
1406
+ use_lang_prompt: false
1407
+ use_matplotlib: true
1408
+ use_nlp_prompt: false
1409
+ use_preprocessor: true
1410
+ use_tensorboard: true
1411
+ val_scheduler_criterion:
1412
+ - valid
1413
+ - loss
1414
+ valid_batch_bins: null
1415
+ valid_batch_size: null
1416
+ valid_batch_type: null
1417
+ valid_iterator_type: null
1418
+ valid_max_cache_size: null
1419
+ version: '202402'
1420
+ write_collected_feats: false
hyp.trn ADDED
The diff for this file is too large to render. See raw diff
 
ref.trn ADDED
The diff for this file is too large to render. See raw diff
 
valid.loss.best.pth ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:d894d5846e5d811a6c860174ba957f81db22dbb0275f6724d1c47f46ec0a8ac1
3
+ size 1281974028