Published on5 tháng 2, 2024Từ LoRA đến LongLoRA: Nhẹ hơn, dài hơn và sướng hơn - Phần 1deep-learninglorallmfine-tuneLoRA đã trở thành một kĩ thuật fine-tuning được sử dụng rộng rãi với sự tối ưu của nó. Trong series này, chúng ta sẽ thảo luận về LoRA, lượng tử hoá và một phiên bản mở rộng của LoRA với context dài hơn.
Published on15 tháng 1, 2024Từ GPT-3 đến LLaMA-2: Cú tát của Mark xoăn vào OpenAIdeep-learningtransformergptllamaLLaMA-2 được tung ra với một paper dài 77 trang mô tả đầy đủ về tất cả kĩ thuật sử dụng và mở cho cả mục đích thương mại.
Published on8 tháng 1, 2024Transformer - Không phải anh hùng, đây là kỉ nguyên của GenAIdeep-learningtransformerTransformer - Không phải anh hùng, đây là kỉ nguyên của GenAI
Published on1 tháng 1, 2024Recap 6 tháng làm việc ở Big TechdailyworkingMột chút chia sẻ về thời gian 6 tháng qua làm việc tại Ban CNTT Tập đoàn Viettel