关于运行流程

感谢分享！新的训练思路！
在这里我一个小白想提出几个我的疑问。期待大佬的解答！
我在使用[block_expansion.py](https://github.com/TencentARC/LLaMA-Pro/blob/main/scripts/block_expansion.py)给Llama3-Chinese_v2扩展后会在指定目录出现一个pytorch_model.bin文件。
第一个问题：请问一下这个pytorch_model.bin文件是否含有原Llama3-Chinese_v2的能力？

在出现这个文件之后我把原有Llama3-Chinese_v2的相关文件复制进来一份。然后执行[finetune_codealpaca.sh](https://github.com/hills-code/open-instruct/blob/7c2b14d3d319028c68657946ca2c16b248f866e8/scripts/finetune_codealpaca.sh) 
第二个问题：我在训练这个新的模型文件时如何选择训练方式  pt或者sft如何进行选择？




Provide feedback

Saved searches

Use saved searches to filter your results more quickly

关于运行流程 #30

Metadata

Assignees

Labels

Type

Projects

Milestone

Relationships

Development

关于运行流程 #30

Description

Metadata

Metadata

Assignees

Labels

Type

Projects

Milestone

Relationships

Development

Issue actions