Skip to content

【桨声灯影计划 · 基建篇】飞桨基础设施相关任务汇总与跟进 #78391

@PlumBlossomMaid

Description

@PlumBlossomMaid

一、 背景说明

桨声灯影是一个意在通过长达数年的代码编写、目标在歌声合成领域基于飞桨打造优秀的产品的计划。俗话说“盖楼先盖地基”,目前该计划正处于基础设施建设阶段。

在建设和完善飞桨基础设施的过程中,我发现并处理了一系列涉及核心框架、周边生态及工具链的问题。根据与 @luotao1 @zxcd 的沟通,现将所有相关的Issues和PRs汇总于此,以便集中跟踪和推进。

二、 核心基建相关任务(直接与框架底层相关)

这部分是当前的主要工作,涉及框架的稳定性、功能完整性和易用性。

类型 链接 状态与说明
Issue #77752 【Windows + CUDA 12.x】 Windows平台上CUDA 12.x版本存在异常行为,似乎只能由我来测试和跟进。
Issue #77754 【DataLoader 重要问题】 发现dataloader不支持无Tensor的迭代,遇到没有Tensor的for循环会直接break。这个问题对框架很重要,但目前我个人时间紧张,希望官方或社区同学能关注和修复。
Issue + PR #77927
#78307
【线程安全】 设备管理线程安全问题,已通过PR解决,等待Review。
Issue + PR #78078 【高层API架构讨论】 paddle.Model现有架构设计偏老旧,需等待官方人员在该Issue下沟通新的设计方案,暂无需开发操作。
Issue + PR #78100 【高层API架构讨论】 paddle.metric.Metric架构讨论,与paddle.Model类似,该模块同样存在架构优化空间,仅需与官方人员在Issue中讨论新设计思路,无紧急开发任务。
PR #78032 【新增功能】 个人首次提交的PR,为paddle增加了resample函数。流程已走完,等待合入。
PR #78307 【线程安全】 设备线程安全问题的代码修复(与上述#77927关联)。
RFC community#1215 【设计提案】 提议新增一个设备上下文管理类,支持装饰器和with用法。
RFC community#1216 【设计提案】 设备线程安全问题的整体RFC。

三、 生态与工具链相关任务(间接相关,但影响使用体验)

这部分是使用飞桨生态时遇到的其他问题,虽然不是最核心的框架代码,但对开发体验影响很大。

类型 链接 状态与说明
Issue #77499 【ONNX算子】 stft ONNX算子支持,优先级不高,可以后续跟进。
Issue + PR #78370
warp-transducer#2
warp-ctc#181
【Windows编译】 修复了warp-transducerwarp-ctc在Windows下的编译问题。但 @luotao1 指出这两个库年久失修,若要合入需自行编写CI脚本,待处理。
Issue #4156 【PaddleSpeech版本发布】 PyPI包严重过时(近一年未更新),导致用户体验差并造成项目bug多的假象。等官方新版本发布后可关闭此Issue。
PR #4159 【PaddleSpeech小修复】 更新了配置文件中的小错误,等待Review和Merge。
Issue #592 【PGL安装问题】 安装脚本错误修改__builtins__导致pip安装失败,用户只能通过源码安装。希望官方修复并发布补丁版本。
Issue #832 【PaConvert工具】 torch.bartlett_window API缺少对应的转换代码,已记录。
Issue + PR #4
#8
【paddle_geometric】 1. 导入时会错误地尝试import torch,导致冲突;2. 替换了其中一些inplace算子的使用,避免梯度计算图出错。
Issue #2358
#2359
【PaddleCustomDevice】 在AI Studio上使用iluvatar_gpu时的问题:1. bincount算子异常行为(可能因atomic导致hang);2. 退出Python时发生段错误。维护人员已知晓,后续会修复。
Issue #22424 【Keras后端】 提议为Keras增加Paddle后端,有助于飞桨走向更广阔的世界。目前Keras团队正在评审,我们只需定期跟进,无论结果如何都是有益的尝试。
PR #1291 【VisualDL】 修复了因使用过时numpy代码导致的问题。
PR + RFC PaddleMaterials#245
community#1214
【模型复现】PaddleMaterials增加了ECDFormer的复现。代码和训练算法会根据Review意见持续优化;关联的RFC会待代码稳定后更新。

其中:

  • 需要官方支持或讨论的:如高层API架构设计(#78078, #78100)、DataLoader重要问题(#77754)等。
  • 需要重点推进的:如warp-ctc、warp-transducer库合入(需CI支持)等。
  • 需要长期跟进的:如Keras后端支持(#22424)。

欢迎各位官方同学和社区伙伴参与讨论、Review或协助推进。感谢大家的支持!

Metadata

Metadata

Assignees

Labels

No labels
No labels

Type

No type

Projects

No projects

Milestone

No milestone

Relationships

None yet

Development

No branches or pull requests

Issue actions