# AWDE 0619-FDE Final Description Boosting Results

日期：2026-06-19

## 实验目标

0615/0616 结果显示，直接使用 final description gate 或把 FD 消融掉后，收益并不稳定。用户判断问题可能在提权方式：模态解释应当仍是真正的 Q 和主信息，FD 只应根据大模型对全局原始数据的分析，指出哪些证据或模态更值得提高权重。

本实验在 `/root/AWDE/0615` 基础上新建 `/root/AWDE/0619-fde`，设计并验证两种更克制的 FD 提权方法。

## 方法设计

### Method A: `token_residual`

- FD 对 explanation-aligned evidence tokens 做相关性打分。
- 相关性只打开一个小的 learnable residual adapter。
- FD 不作为 value，不替代 token，不做直接大幅乘权。
- 本次超参：`fd_token_alpha=0.08/0.12`。

### Method B: `router_prior`

- FD 不接触 evidence tokens。
- FD 只生成三模态 relevance prior，并与外部 `fusion_weights` 轻量混合。
- 混合后的 prior 仍满足 SMoE 的 floor 约束，再进入 floor-bounded SMoE。
- 本次超参：`fd_router_alpha=0.15/0.20`。

为了隔离新方法，四个正式 run 均关闭旧 FD 使用：

```text
desc_gate_mode=none
desc_alpha=0.0
temporal_desc_bias=0.0
```

保留 0615 主干：encoder-FRA features、explanation align、Directed EATS time anchor/reliability、floor-bounded prior SMoE、SmoothL1、EMA、validation composite selection。

## 4卡结果

| Run | Method | Hidden | Batch | LR | Alpha | Best | Source | Composite | Has0 | Non0 | Acc-5 | Acc-7 | MAE | Corr | Zero-F1 | Router [T,A,V] |
| --- | --- | ---: | ---: | ---: | ---: | ---: | --- | ---: | ---: | ---: | ---: | ---: | ---: | ---: | ---: | --- |
| `fde_tokenres_h128_a08_lr8e5_b12_d12` | token_residual | 128 | 12 | 8e-5 | 0.08 | 5 | ema | 0.674150 | 0.8367 | 0.8756 | 0.5945 | 0.5746 | 0.4785 | 0.8185 | 0.6811 | [0.621033, 0.214516, 0.164451] |
| `fde_tokenres_h160_a12_lr5e5_b8_d15` | token_residual | 160 | 8 | 5e-5 | 0.12 | 4 | ema | 0.661160 | 0.8500 | 0.8850 | 0.5888 | 0.5699 | 0.4804 | 0.8169 | 0.6766 | [0.542051, 0.290596, 0.167353] |
| `fde_router_h128_a15_lr8e5_b12_d12` | router_prior | 128 | 12 | 8e-5 | 0.15 | 4 | ema | 0.656260 | 0.8407 | 0.8828 | 0.5789 | 0.5602 | 0.4844 | 0.8128 | 0.6739 | [0.656666, 0.192288, 0.151046] |
| `fde_router_h160_a20_lr5e5_b8_d15` | router_prior | 160 | 8 | 5e-5 | 0.20 | 4 | ema | 0.666070 | 0.8476 | 0.8792 | 0.5950 | 0.5752 | 0.4809 | 0.8175 | 0.6827 | [0.660069, 0.187806, 0.152125] |

4-run mean/std：

| Metric | Mean | Std |
| --- | ---: | ---: |
| Has0_acc_2 | 0.8438 | 0.0061 |
| Non0_acc_2 | 0.8807 | 0.0041 |
| Mult_acc_5 | 0.5893 | 0.0075 |
| Mult_acc_7 | 0.5700 | 0.0069 |
| MAE | 0.4810 | 0.0025 |
| Corr | 0.8164 | 0.0025 |
| Zero_F1 | 0.6786 | 0.0040 |

## 对比与判断

0615 encoder-FRA 参考结果：

| Method | Has0 | Non0 | Acc-5 | Acc-7 | MAE | Corr |
| --- | ---: | ---: | ---: | ---: | ---: | ---: |
| 0615 valid-composite winner | 0.8324 | 0.8795 | 0.5823 | 0.5621 | 0.4905 | 0.8123 |
| 0615 test-best h160 | 0.8465 | 0.8861 | 0.5888 | 0.5692 | 0.4812 | 0.8184 |
| 0615 4-run mean | 0.8372 | 0.8780 | 0.5837 | 0.5641 | 0.4876 | 0.8125 |

0616 strict FD ablation 2-run mean：

| Method | Has0 | Non0 | Acc-5 | Acc-7 | MAE | Corr | Zero-F1 |
| --- | ---: | ---: | ---: | ---: | ---: | ---: | ---: |
| 0616 FD ablation mean | 0.8390 | 0.8810 | 0.5855 | 0.5665 | 0.4838 | 0.8141 | 0.6783 |

本次 0619-FDE mean 相对 0615 mean：

| Metric | 0619-FDE mean | 0615 mean | Delta |
| --- | ---: | ---: | ---: |
| Has0_acc_2 | 0.8438 | 0.8372 | +0.0066 |
| Non0_acc_2 | 0.8807 | 0.8780 | +0.0027 |
| Mult_acc_5 | 0.5893 | 0.5837 | +0.0056 |
| Mult_acc_7 | 0.5700 | 0.5641 | +0.0059 |
| MAE | 0.4810 | 0.4876 | -0.0066 |
| Corr | 0.8164 | 0.8125 | +0.0039 |

本次 0619-FDE mean 相对 0616 FD ablation mean：

| Metric | 0619-FDE mean | 0616 FD ablation | Delta |
| --- | ---: | ---: | ---: |
| Has0_acc_2 | 0.8438 | 0.8390 | +0.0048 |
| Non0_acc_2 | 0.8807 | 0.8810 | -0.0003 |
| Mult_acc_5 | 0.5893 | 0.5855 | +0.0038 |
| Mult_acc_7 | 0.5700 | 0.5665 | +0.0035 |
| MAE | 0.4810 | 0.4838 | -0.0028 |
| Corr | 0.8164 | 0.8141 | +0.0023 |
| Zero_F1 | 0.6786 | 0.6783 | +0.0003 |

## 结论

- 两种新 FD 提权方式都能稳定跑完，且没有出现 0618 那种 FD 过强主导的问题。
- 4-run mean 全面好于 0615 mean，说明 FD 不是没有价值，关键是不能让 FD 直接成为主路径。
- `token_residual` 更均衡：最佳单 run `fde_tokenres_h160_a12_lr5e5_b8_d15` Has0=0.8500，Non0=0.8850；`fde_tokenres_h128_a08` MAE/Corr 表现更强，MAE=0.4785，Corr=0.8185。
- `router_prior` 中 h160/a20 的 Acc-5/Acc-7 最强，Acc-5=0.5950，Acc-7=0.5752；说明 FD 作为模态先验校准也有效，但 h128/a15 偏弱。
- 推荐论文主方法优先写 `token_residual`，`router_prior` 可作为 FD 利用方式的补充实验或附录。

## 产物

- 代码目录：`/root/AWDE/0619-fde`
- 输出目录：`/root/siton-data-531cb60d91bd4013b805b412b0be2176/tlw/store/AWDE/0619-fde`
- 启动脚本：`/root/AWDE/0619-fde/scripts/start_0619_fde_npu4.sh`
- 汇总脚本：`/root/AWDE/0619-fde/scripts/summarize_0619_fde_runs.py`
