All Posts

Published on
8 tháng 2, 2024
Từ LoRA đến LongLoRA: Nhẹ hơn, dài hơn và sướng hơn - Phần 2
deep-learning lora llm fine-tune
Ở trong bài này, chúng ta cùng thảo luận kĩ hơn về QLoRA và LongLoRA - hai kĩ thuật được phát triển từ LoRA với các mục đích tối ưu hơn cho từng mục đích
Published on
5 tháng 2, 2024
Từ LoRA đến LongLoRA: Nhẹ hơn, dài hơn và sướng hơn - Phần 1
deep-learning lora llm fine-tune
LoRA đã trở thành một kĩ thuật fine-tuning được sử dụng rộng rãi với sự tối ưu của nó. Trong series này, chúng ta sẽ thảo luận về LoRA, lượng tử hoá và một phiên bản mở rộng của LoRA với context dài hơn.
Published on
15 tháng 1, 2024
Từ GPT-3 đến LLaMA-2: Cú tát của Mark xoăn vào OpenAI
deep-learning transformer gpt llama
LLaMA-2 được tung ra với một paper dài 77 trang mô tả đầy đủ về tất cả kĩ thuật sử dụng và mở cho cả mục đích thương mại.
Published on
8 tháng 1, 2024
Transformer - Không phải anh hùng, đây là kỉ nguyên của GenAI
deep-learning transformer
Transformer - Không phải anh hùng, đây là kỉ nguyên của GenAI
Published on
1 tháng 1, 2024
Recap 6 tháng làm việc ở Big Tech
daily working
Một chút chia sẻ về thời gian 6 tháng qua làm việc tại Ban CNTT Tập đoàn Viettel

Từ LoRA đến LongLoRA: Nhẹ hơn, dài hơn và sướng hơn - Phần 2