# AWDE 0616 Final Description Ablation 结果

日期：2026-06-16

## 1. 实验目标

本实验按 0605-melt 的消融口径，在 0615 encoder-FRA 特征基础上做严格 final description ablation。

消融定义：

- `desc_gate_mode=none`：关闭 final description token gate/reweight。
- `desc_alpha=0.0`：确保 FD gate 强度为 0。
- `temporal_desc_bias=0.0`：关闭 EATS 内部 final-description bias。
- 保留 explanation align、Directed EATS 的时间锚点/可靠性机制、LLM fusion weight prior SMoE、SmoothL1、EMA/composite selection。

## 2. 代码与数据

- 代码目录：`/root/AWDE/0616`
- 输出目录：`/root/siton-data-531cb60d91bd4013b805b412b0be2176/tlw/store/AWDE/0616`
- pkl：`/root/siton-data-531cb60d91bd4013b805b412b0be2176/tlw/store/pkl/0615/mosei_awde_0615_encoder_raw512_fp16.pkl`
- 启动脚本：`/root/AWDE/0616/scripts/start_0616_fd_ablation_and_figure_npu4.sh`
- 汇总脚本：`/root/AWDE/0616/scripts/summarize_0616_runs.py`

- 0616 从 0615 encoder-FRA 代码复制，保留 `text_dim/audio_dim/vision_dim` 自动推断以适配 5120/1024/768 新特征。
- 合并 0612 的正确 FD 放置：`DescriptionMicroReweighter` 只用 final description 作为 Q，对已有 evidence token 产生 scalar gate，不把 FD token 当 value，也不替换 token 序列。
- `awde_model.py` 中 text 分支不做 FD reweight；audio/vision 分支可在 post-align 后做 FD reweight，再进入 EATS。
- `temporal_desc_bias=0.0` 时 EATS 内部完全关闭 final-description bias，只保留 explanation-attention soft anchor、time bias 与 reliability/confidence bias。

## 3. 双卡超参

| Run | NPU | hidden | batch | lr | dropout | 目的 |
| --- | --- | --- | --- | --- | --- | --- |
| `fd_ablate_h128_lr8e5_b12_d12` | 0 | 128 | 12 | 8e-5 | 0.12 | 对应 0615 valid composite winner 的训练口径 |
| `fd_ablate_h160_lr5e5_b8_d15` | 1 | 160 | 8 | 5e-5 | 0.15 | 对应 0615 test 端最强 h160 口径 |

共同设置：`feature_layers=2, align_layers=2, temporal_align_type=eats, temporal_sigma=0.08, prior_strength=2.0, weight_floor=0.1, SmoothL1(beta=0.5), EMA=0.997, selection=Corr - 0.50*MAE + 0.20*Acc-5`。

## 4. 运行状态

- 运行状态：`fd_ablate_h128_lr8e5_b12_d12`=completed, `fd_ablate_h160_lr5e5_b8_d15`=completed。
- 正式结果按 EMA validation composite 选择 checkpoint。

## 5. 正式结果

| Run | Config | Best | Source | Composite | Has0 | Non0 | Acc-3 | Acc-5 | Acc-7 | MAE | Corr | Zero-F1 | Router [T,A,V] |
| --- | --- | ---: | --- | ---: | ---: | ---: | ---: | ---: | ---: | ---: | ---: | ---: | --- |
| `fd_ablate_h128_lr8e5_b12_d12` | h128/b12/lr8e-5/d0.12 | 4 | ema | 0.650540 | 0.8364 | 0.8795 | 0.7034 | 0.5830 | 0.5641 | 0.4856 | 0.8113 | 0.6808 | [0.559742, 0.248589, 0.191669] |
| `fd_ablate_h160_lr5e5_b8_d15` | h160/b8/lr5e-5/d0.15 | 4 | ema | 0.661500 | 0.8416 | 0.8825 | 0.7085 | 0.5879 | 0.5688 | 0.4820 | 0.8169 | 0.6757 | [0.490491, 0.32551, 0.183999] |

2-run mean/std：

| Metric | Mean | Std |
| --- | ---: | ---: |
| Has0_acc_2 | 0.8390 | 0.0037 |
| Non0_acc_2 | 0.8810 | 0.0021 |
| Mult_acc_5 | 0.5855 | 0.0035 |
| Mult_acc_7 | 0.5665 | 0.0033 |
| MAE | 0.4838 | 0.0025 |
| Corr | 0.8141 | 0.0040 |
| Zero_F1 | 0.6783 | 0.0036 |

与 0615 paired baseline 的 delta：

| Run | Paired baseline | dHas0 | dNon0 | dAcc-5 | dAcc-7 | dMAE | dCorr | dZero-F1 |
| --- | --- | ---: | ---: | ---: | ---: | ---: | ---: | ---: |
| `fd_ablate_h128_lr8e5_b12_d12` | 0615 h128 b12 | +0.0040 | +0.0000 | +0.0007 | +0.0020 | -0.0049 | -0.0010 | +0.0075 |
| `fd_ablate_h160_lr5e5_b8_d15` | 0615 h160 b8 | -0.0049 | -0.0036 | -0.0009 | -0.0004 | +0.0008 | -0.0015 | +0.0033 |

FD ablation mean 相对 0615 encoder-FRA mean：

| Metric | This | 0615 Encoder-FRA mean | Delta |
| --- | ---: | ---: | ---: |
| Has0_acc_2 | 0.8390 | 0.8372 | +0.0018 |
| Non0_acc_2 | 0.8810 | 0.8780 | +0.0030 |
| Mult_acc_5 | 0.5855 | 0.5837 | +0.0018 |
| Mult_acc_7 | 0.5665 | 0.5641 | +0.0023 |
| MAE | 0.4838 | 0.4876 | -0.0038 |
| Corr | 0.8141 | 0.8125 | +0.0016 |
| Zero_F1 | 0.6783 | 0.6727 | +0.0056 |

FD ablation mean 相对 0602-6 Original Full：

| Metric | This | 0602-6 Original Full | Delta |
| --- | ---: | ---: | ---: |
| Has0_acc_2 | 0.8390 | 0.8410 | -0.0020 |
| Non0_acc_2 | 0.8810 | 0.8690 | +0.0120 |
| Mult_acc_5 | 0.5855 | 0.5851 | +0.0004 |
| Mult_acc_7 | 0.5665 | 0.5666 | -0.0001 |
| MAE | 0.4838 | 0.5038 | -0.0200 |
| Corr | 0.8141 | 0.7967 | +0.0174 |
| Zero_F1 | 0.6783 | 0.6771 | +0.0011 |

## 6. 结论

- validation composite 最强是 `fd_ablate_h160_lr5e5_b8_d15`，Best epoch=4，Composite=0.661500。
- test MAE 最低是 `fd_ablate_h160_lr5e5_b8_d15`，MAE=0.4820，Corr=0.8169。
- 这组结果用于回答“final description 是否必要”：去掉 FD 后，模型仍能依靠 encoder-FRA 特征、explanation align、EATS anchor 和 SMoE prior 维持较强性能。
- 论文写法建议不要把 FD 写成模型唯一信息来源；更稳妥的表述是 FD 是 token 校准/证据重权重信号，需要和图示方法一起看收益。

