Category: LLM

All the articles with the category "LLM".

Projects

Education

BERT Fine-tuning

Improving a Japanese Text-Generation Model through Fine-Tuning BERT.

PythonPyTorchBERTTransformer

Personal

Build a GPT-like LLM from scratch

An attempt to build a GPT-style LLM from scratch with PyTorch. Covers the full architecture, pre-training loop, decoding strategies, and loading OpenAI GPT-2 weights.

Category: LLM

Projects

BERT Fine-tuning

Build a GPT-like LLM from scratch

Build Large Reasoning Model (LRM) from scratch

Mike 3.0: RAG Powered LLM Model for Chatbot Backend

RAG vs LoRA: LLM Fine-Tuning Comparison for Mike 3.0

PKM Notes

Absolute Positional Embedding

Aha Moment (Deep Seek R1)

Attention Mechanism

Attention Scores

Attention Weights

Batch Size

BOS Token

Broadcasting (Tensor Operation)

Chain-of-Thought Prompting Elicits Reasoning in Large Language Models

Chain-of-Thought Prompting

Compiler Feedback Loop

Context Vector

Context Window

DeepSeek-R1 - Incentivizing Reasoning Capability in LLMs via Reinforcement Learning

Emergent Behavior

EndOfText Token

DataLoader (PyTorch)

Few-shot Learning

GGUF (GPT-Generated Unified Format)

Inference Time Compute Scaling

Input Embeddings (Transformer)

Input-Target Pairs

LlamaEdge

LLM Distillation

Low-Rank Adaptation (LoRA)

Next Word Prediction

One-Hot Encoding

One-shot Learning

Parallel Computing (DataLoader)

Positional Embedding

Quantization (DeepSeek)

Quantized Low-Rank Adaptation (QLoRA)

Reasoning Model Blueprint (SFT + RL)

Relative Positional Embedding

Scaled Dot-Product Attention

Sliding Window Technique

Stride (Sliding Window Technique)

System 1 Thinking

System 2 Thinking

Test Time Compute

Token ID (LLM)

Tokenization

Transformer

Vector Embedding

Vocabulary (Tokenizer)

Zero-shot Learning

Chat with Mike 3.0