# AWDE 0616 Figure Method: Post-align FD Reweight 结果

日期：2026-06-16

## 1. 实验目标

本实验按用户上传图片中的 AWDE 主图方法，在 0615 encoder-FRA 特征基础上实现并验证：

- explanation align：refined explanation 作为 Q，encoder-FRA 模态 token 作为 K/V，得到 evidence token。
- final description reweighted tokens：final description 只作为 Q，对 audio/vision evidence token 做 scalar gate。
- EATS：对 reweighted audio/vision token 做 explanation-attention temporal synchronizer。
- pooling 后进入 LLM-routed SMoE，fusion weights 以 floor-bounded prior 进入 router。

关键约束：不把 final description token 当 value，不替换 evidence token 序列；text 分支不做 FD reweight。

## 2. 代码与数据

- 代码目录：`/root/AWDE/0616`
- 输出目录：`/root/siton-data-531cb60d91bd4013b805b412b0be2176/tlw/store/AWDE/0616`
- pkl：`/root/siton-data-531cb60d91bd4013b805b412b0be2176/tlw/store/pkl/0615/mosei_awde_0615_encoder_raw512_fp16.pkl`
- 启动脚本：`/root/AWDE/0616/scripts/start_0616_fd_ablation_and_figure_npu4.sh`
- 汇总脚本：`/root/AWDE/0616/scripts/summarize_0616_runs.py`

- 0616 从 0615 encoder-FRA 代码复制，保留 `text_dim/audio_dim/vision_dim` 自动推断以适配 5120/1024/768 新特征。
- 合并 0612 的正确 FD 放置：`DescriptionMicroReweighter` 只用 final description 作为 Q，对已有 evidence token 产生 scalar gate，不把 FD token 当 value，也不替换 token 序列。
- `awde_model.py` 中 text 分支不做 FD reweight；audio/vision 分支可在 post-align 后做 FD reweight，再进入 EATS。
- `temporal_desc_bias=0.0` 时 EATS 内部完全关闭 final-description bias，只保留 explanation-attention soft anchor、time bias 与 reliability/confidence bias。

## 3. 双卡超参

| Run | NPU | hidden | batch | lr | dropout | desc_alpha | 目的 |
| --- | --- | --- | --- | --- | --- | --- | --- |
| `fig_postfd_h128_lr8e5_b12_a05` | 2 | 128 | 12 | 8e-5 | 0.12 | 0.05 | 低强度 FD reweight，对应 0615 valid-winner 口径 |
| `fig_postfd_h160_lr5e5_b8_a10` | 3 | 160 | 8 | 5e-5 | 0.15 | 0.10 | 稍高容量/稍强 FD reweight，对应 0615 h160 test-best 口径 |

共同设置：`desc_gate_mode=post_align, temporal_desc_bias=0.0, feature_layers=2, align_layers=2, temporal_align_type=eats, temporal_sigma=0.08, prior_strength=2.0, weight_floor=0.1, SmoothL1(beta=0.5), EMA=0.997, selection=Corr - 0.50*MAE + 0.20*Acc-5`。

## 4. 运行状态

- 运行状态：`fig_postfd_h128_lr8e5_b12_a05`=completed, `fig_postfd_h160_lr5e5_b8_a10`=completed。
- 正式结果按 EMA validation composite 选择 checkpoint。

## 5. 正式结果

| Run | Config | Best | Source | Composite | Has0 | Non0 | Acc-3 | Acc-5 | Acc-7 | MAE | Corr | Zero-F1 | Router [T,A,V] |
| --- | --- | ---: | --- | ---: | ---: | ---: | ---: | ---: | ---: | ---: | ---: | ---: | --- |
| `fig_postfd_h128_lr8e5_b12_a05` | h128/b12/lr8e-5/d0.12 | 5 | ema | 0.653510 | 0.8407 | 0.8808 | 0.7096 | 0.5937 | 0.5737 | 0.4786 | 0.8188 | 0.6821 | [0.554433, 0.272322, 0.173245] |
| `fig_postfd_h160_lr5e5_b8_a10` | h160/b8/lr5e-5/d0.15 | 4 | ema | 0.664320 | 0.8382 | 0.8781 | 0.7072 | 0.5881 | 0.5679 | 0.4830 | 0.8152 | 0.6721 | [0.4796, 0.285557, 0.234844] |

2-run mean/std：

| Metric | Mean | Std |
| --- | ---: | ---: |
| Has0_acc_2 | 0.8395 | 0.0018 |
| Non0_acc_2 | 0.8795 | 0.0019 |
| Mult_acc_5 | 0.5909 | 0.0040 |
| Mult_acc_7 | 0.5708 | 0.0041 |
| MAE | 0.4808 | 0.0031 |
| Corr | 0.8170 | 0.0025 |
| Zero_F1 | 0.6771 | 0.0071 |

与 0615 paired baseline 的 delta：

| Run | Paired baseline | dHas0 | dNon0 | dAcc-5 | dAcc-7 | dMAE | dCorr | dZero-F1 |
| --- | --- | ---: | ---: | ---: | ---: | ---: | ---: | ---: |
| `fig_postfd_h128_lr8e5_b12_a05` | 0615 h128 b12 | +0.0083 | +0.0013 | +0.0114 | +0.0116 | -0.0119 | +0.0065 | +0.0088 |
| `fig_postfd_h160_lr5e5_b8_a10` | 0615 h160 b8 | -0.0083 | -0.0080 | -0.0007 | -0.0013 | +0.0018 | -0.0032 | -0.0003 |

Figure method mean 相对 0615 encoder-FRA mean：

| Metric | This | 0615 Encoder-FRA mean | Delta |
| --- | ---: | ---: | ---: |
| Has0_acc_2 | 0.8395 | 0.8372 | +0.0022 |
| Non0_acc_2 | 0.8795 | 0.8780 | +0.0015 |
| Mult_acc_5 | 0.5909 | 0.5837 | +0.0072 |
| Mult_acc_7 | 0.5708 | 0.5641 | +0.0067 |
| MAE | 0.4808 | 0.4876 | -0.0068 |
| Corr | 0.8170 | 0.8125 | +0.0045 |
| Zero_F1 | 0.6771 | 0.6727 | +0.0044 |

Figure method mean 相对 0602-6 Original Full：

| Metric | This | 0602-6 Original Full | Delta |
| --- | ---: | ---: | ---: |
| Has0_acc_2 | 0.8395 | 0.8410 | -0.0015 |
| Non0_acc_2 | 0.8795 | 0.8690 | +0.0105 |
| Mult_acc_5 | 0.5909 | 0.5851 | +0.0058 |
| Mult_acc_7 | 0.5708 | 0.5666 | +0.0042 |
| MAE | 0.4808 | 0.5038 | -0.0230 |
| Corr | 0.8170 | 0.7967 | +0.0203 |
| Zero_F1 | 0.6771 | 0.6771 | +0.0000 |

## 6. 结论

- validation composite 最强是 `fig_postfd_h160_lr5e5_b8_a10`，Best epoch=4，Composite=0.664320。
- test MAE 最低是 `fig_postfd_h128_lr8e5_b12_a05`，MAE=0.4786，Corr=0.8188。
- Acc-5 最高是 `fig_postfd_h128_lr8e5_b12_a05`，Acc-5=0.5937，Acc-7=0.5737。
- 这组是更贴合图片的正式方法口径：FD 不是额外 value，而是 post-align evidence token 的轻量重权重信号，再交给 EATS 和 SMoE。
- 论文写法建议把该方法作为主图对应实现，与 strict FD ablation 成对报告，突出 FD 放在 post-align/pre-EATS 的 token reweight 位置更合理。

