想請教關於Fine tuning時的資料集要求

想請教一下在進行微調時是否有需要對資料的格式進行處理，在網路上有看到不同作法，例如：

以alpaca格式，儲存為jsonl形式後，直接作為資料集提供給SFTTrainer進行微調。
將對話以<s>[INST] {instruction} [/INST] {response} </s>的形式紀錄，並直接提供給SFTTrainer進行微調。
將(1)(2)的資料集以tokenizer進行處理後，取得attention_mask以及input_ids後才提供給SFTTrainer進行微調。

想詢問哪一種方式會是比較好的，同時也好奇attention_mask在微調過程中的必要性，以目前Hugging Face的SFTTrainer而言，並未有一個參數能指定這個mask的名稱，實在不確定提供了之後是否會被使用，以及這向資訊是否為必要的。

感謝撥冗閱讀，還請不吝賜教。

MiuLab / Taiwan-LLM