Skip to content

ChatPiPxiu v1-开发计划讨论:资料调研+通用最小实现+领域/任务适配? #1

@catqaq

Description

@catqaq

目前我们正在启动V1版本的开发,整体的开发计划如下,主要包括了文档和代码两类任务,数据的部分我们暂时将其分散到了各个子任务中。

V1版本:资料调研+通用最小实现+领域/任务适配

1.1 文档分支
文档分支主要负责项目文档的建设,包括通用技术文档和项目相关文档。

dev_for_docs:文档分支,主要负责资料调研(算力有限,有调查才有训练权):

【P0】开源ChatGPT调研:持续更新,doing
【P0】训练技术调研:持续更新,doing
【P0】数据调研:doing
【P1】部署技术调研:TODO
【P2】基础模型调研:目前以LLaMA和GLM为主,doing
【P3】技术解读/教程:doing
1.2 代码分支
代码分支,负责具体的开发工作,包括数据处理、算法开发、算法评测等,分成通用最小实现和领域/任务适应两种,具体的:

dev_for_chatmini:通用最小实现分支,尽可能支持不同的基础模型和训练方式,提供可比较的实现。

【P0】ChatGPT最小复现:完整的RLHF复现SFT-RM-PPO,doing
【P0】适配不同的基座模型
适配不同的PEFT算法
【P2】探索新的训练方式
【P3】探索知识迁移:比如蒸馏
dev_for_chatzhihu:知乎及问答领域适配,主要想解决一些知乎使用过程中的痛点,比如问题冗余、回答太多等等。

【P0】收集知乎数据收集及处理
SFT数据
RLHF数据:答案打分
摘要数据:答案/观点汇总、摘要
【P0】基于知乎数据做SFT
【P1】基于知乎数据做RLHF
【P2】输出知乎LoRA
【P3】和知乎热榜聊天的demo
dev_for_chatzhangsan:法律领域适配,张三犯了什么罪?

【P0】法律领域数据收集及处理
法律条文解释
【P1】罪名判定:张三犯了什么罪?
更多领域,敬请期待!

ChatPiXiu-Eat every ChatGPT - Output your own chatbot!

欢迎讨论和建议~

Metadata

Metadata

Assignees

No one assigned

    Labels

    No labels
    No labels

    Type

    No type

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions