Skip to content

【Hackathon 10th Spring No.10】ECDFormer模型复现任务#245

Open
PlumBlossomMaid wants to merge 20 commits intoPaddlePaddle:developfrom
PlumBlossomMaid:ECFormer-Model
Open

【Hackathon 10th Spring No.10】ECDFormer模型复现任务#245
PlumBlossomMaid wants to merge 20 commits intoPaddlePaddle:developfrom
PlumBlossomMaid:ECFormer-Model

Conversation

@PlumBlossomMaid
Copy link

@PlumBlossomMaid PlumBlossomMaid commented Feb 24, 2026

📌 项目介绍

[used AI Studio] 本PR是ECDFormer模型复现任务的核心代码合入申请。ECDFormer(Nature Computational Science 2025)通过“解耦峰属性学习”实现高效、可解释的ECD/IR光谱预测。

目前已根据第一次Review意见完成PR合并版权声明添加,现根据第二次Review意见整理待办清单如下。

✅ 工作进展

已完成

  • 将PR-245与PR-246合并,关闭PR-246
  • 为所有新增文件添加Paddle版权声明

进行中

  • loss/metrics迁移:将utils/loss/下的损失函数移至ppmat/models/losses/公共模块
  • utils工具迁移:将通用工具函数提取到ppmat/utils/公共目录
  • 补充材料提供
    • 提供ECD/IR数据集下载链接
    • 上传预训练模型权重及训练日志文件(如果有)
  • 数据集工厂函数改造:参考build_spectrum的实现方式,重构数据集加载逻辑
  • 补完训练脚本与推理脚本: 根据上述已经固定的API,仿照DiffNMR训练脚本的风格,在spectrum_elucidation\ECFormer目录下补充适用于ECFormer的训练与推理脚本
  • 代码注释英文化:将所有.py文件的注释、docstring修改为英文
  • README文档完善
    • spectrum_elucidation/README.md添加ECFormer系列模型说明
    • 新建spectrum_elucidation/ECFormer/README.md,包含模型说明、复现精度
    • 参考其他任务(如DiffNMR)完善文档格式
  • RFC文档同步更新:根据最终代码实现,更新之前提交的RFC设计文档

🔗 相关链接


感谢Reviewer的耐心指导,所有待办将按清单顺序依次推进。

@paddle-bot
Copy link

paddle-bot bot commented Feb 24, 2026

Thanks for your contribution!

@paddle-bot paddle-bot bot added the contributor External developers label Feb 24, 2026
Removed duplicate import of OMol25Dataset.
@leeleolay
Copy link
Collaborator

leeleolay commented Feb 26, 2026

@PlumBlossomMaid 感谢您的代码贡献,有如下合入规范的建议辛苦参考:辛苦将本PR和PR-246合并为一个,代码注释修改为英文,并在每个文件前添加Paddle权利声明,数据集的加载辛苦使用build的工厂函数方式,utils里面的内容可以提取到model外ppmat里相应的部分,在spectrunm elucidation里面的readme添加模型说明,并且添加模型readme页面并且声明模型复现效果,辛苦提供数据集链接和预训练模型权重log文件

@PlumBlossomMaid PlumBlossomMaid changed the title 【Hackathon 10th Spring No.10】ECDFormer模型复现任务Models部分 【Hackathon 10th Spring No.10】ECDFormer模型复现任务 Feb 27, 2026
Copy link
Collaborator

@leeleolay leeleolay left a comment

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

添加模型复现精度说明,并且补充readme文档,可以参考其他任务里的模型的情况。loss和metric的部分可以移动到ppmat下的公共模块部分

# limitations under the License.

"""
ECDFormer数据集加载模块
Copy link
Collaborator

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

注释请修改为英文

Copy link
Author

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

好的好的~近几天较忙,所有review中的要求我会依次进行~

@PlumBlossomMaid
Copy link
Author

IR数据集我发天翼云网盘了,请通过这里获取,访问码:7sax。
如果不方便注册账号,可以通过文件直链的形式进行下载,点击这里,文件直链有效期为30天。

@leeleolay
Copy link
Collaborator

IR数据集我发天翼云网盘了,请通过这里获取,访问码:7sax。 如果不方便注册账号,可以通过文件直链的形式进行下载,点击这里,文件直链有效期为30天。

https://paddle-org.bj.bcebos.com/paddlematerials/datasets/IR/IR.tar.gz 请参考这个链接 @PlumBlossomMaid

@PlumBlossomMaid
Copy link
Author

@leeleolay

麻烦帮忙看看 ECD 和 IR 数据集的工厂函数改造是否符合要求:

  • ECD 数据集:拆分为 ecformer_dataset.py + build_ecd.py(工厂函数+核心逻辑)
  • IR 数据集:同样模式拆分为 ir_dataset.py + build_ir.py

如果结构没问题,我就继续推进后续任务:

  • 补完训练/推理脚本
  • 注释英文化
  • README 文档完善
  • RFC 同步更新

多谢!

@leeleolay
Copy link
Collaborator

leeleolay commented Mar 12, 2026

注释comment辛苦修改为英文

@PlumBlossomMaid
Copy link
Author

注释comment辛苦修改为英文

好的好的,这次申请Review主要是想确认数据集代码格式没有问题。关于代码和项目的语言我会在最后统一修改。我将抽时间继续完成训练代码的编写。

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment

Labels

contributor External developers

Projects

None yet

Development

Successfully merging this pull request may close these issues.

3 participants