Skip to content

关于运行流程 #30

@GOOD-N-LCM

Description

@GOOD-N-LCM

感谢分享!新的训练思路!
在这里我一个小白想提出几个我的疑问。期待大佬的解答!
我在使用block_expansion.py给Llama3-Chinese_v2扩展后会在指定目录出现一个pytorch_model.bin文件。
第一个问题:请问一下这个pytorch_model.bin文件是否含有原Llama3-Chinese_v2的能力?

在出现这个文件之后我把原有Llama3-Chinese_v2的相关文件复制进来一份。然后执行finetune_codealpaca.sh
第二个问题:我在训练这个新的模型文件时如何选择训练方式 pt或者sft如何进行选择?

Metadata

Metadata

Assignees

No one assigned

    Labels

    No labels
    No labels

    Type

    No type

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions