感谢分享!新的训练思路!
在这里我一个小白想提出几个我的疑问。期待大佬的解答!
我在使用block_expansion.py给Llama3-Chinese_v2扩展后会在指定目录出现一个pytorch_model.bin文件。
第一个问题:请问一下这个pytorch_model.bin文件是否含有原Llama3-Chinese_v2的能力?
在出现这个文件之后我把原有Llama3-Chinese_v2的相关文件复制进来一份。然后执行finetune_codealpaca.sh
第二个问题:我在训练这个新的模型文件时如何选择训练方式 pt或者sft如何进行选择?
感谢分享!新的训练思路!
在这里我一个小白想提出几个我的疑问。期待大佬的解答!
我在使用block_expansion.py给Llama3-Chinese_v2扩展后会在指定目录出现一个pytorch_model.bin文件。
第一个问题:请问一下这个pytorch_model.bin文件是否含有原Llama3-Chinese_v2的能力?
在出现这个文件之后我把原有Llama3-Chinese_v2的相关文件复制进来一份。然后执行finetune_codealpaca.sh
第二个问题:我在训练这个新的模型文件时如何选择训练方式 pt或者sft如何进行选择?