HHWForum.hu
Filmek
TV Sorozatok Feliratos filmek Szinkronos filmek HD és Blu-ray Karácsony Online nézhető filmek Film kollekciók Mobilos filmek Rajzfilmek Dokumentum filmek Horror filmek Magyar filmek DVD ISO HUN DVD ISO ENG DVD-Rip ENG 3D filmek Zenés filmek
Zenék
Zenei Kérések Videóklippek, koncertfelvételek OST Single
Játékok
Játék Kérések
XXX
XXX Játékok XXX Magyar XXX Sorozatok, Gyűjtemények XXX Képek XXX Magazinok, képregények XXX Videók és Rövid filmek
Mobil
Mobilos filmek Mobilos programok Androidos játékok Mobil Háttérképek Csengőhangok
Programok
Windows Op. ISO ENG Windwos Op. ISO HUN Microsoft Office MacOS Program Kérések
Háttérképek
Templates Háttérképek Témák
E-könyvek
E-könyv Kérések Külföldi könyvek Hangoskönyvek Külföldi magazinok Gyerek hangoskönyvek Gyerekdalok
Mai Friss
Belépés   Regisztráció
Belépés
Felhasználónév
Jelszó: Elfelejtett jelszó?
 


Keresés
A fő kategória kiválasztásával az alfórumokban is keres.
Saját feltöltéseim
HHWForum.hu Letöltések E-könyvek Külföldi könyvek Build A DeepSeek Model From Scratch MEAP V2 (Raj Abhijit Dandekar, Rajat Dandekar, Sreedath Panat, Naman Dwivedi)

  • 0 szavazat - átlag 0
  • 1
  • 2
  • 3
  • 4
  • 5
Rétegzési módok
Build A DeepSeek Model From Scratch MEAP V2 (Raj Abhijit Dandekar, Rajat Dandekar, Sreedath Panat, Naman Dwivedi)
Nem elérhető Farid-Khan
Farid-Khan
Uploader
******
Üzenetek: 71,366
Témák: 74,592
Thanks Received: 3 in 3 posts
Thanks Given: 0
Csatlakozott: Jun 2023
Értékelés: 0
#1
2026-02-12. 12:17
[Kép: Build-A-Deep-Seek-Model-From-Scratch-MEAP-V2.jpg]

English | 2025 | ISBN: 9781633434325 | 228 Pages | PDF, EPUB | 43 MB

Idézet:Learn how to build the features that set DeepSeek apart from other top LLMs!

When DeepSeek started making waves in January 2025, it sounded too good to be true. How could a generative AI model get such incredible performance with such low training and operation costs? By creatively blending a variety of strategies and innovations like Mixture of Experts, Latent Attention, Multi-token Prediction, model distillation, and efficient parallelization, DeepSeek set a new standard for what's possible in an open LLM. Now, in Build a DeepSeek Model (From Scratch) you can recreate a laptop-scale version of this cutting-edge model yourself!

In Build a DeepSeek Model (From Scratch) you will learn how to
Implement DeepSeek's core architectural innovations, including Multi-Head Latent Attention and Mixture-of-Experts layers
Build a production-ready training pipeline with Multi-Token Prediction and FP8 quantization for efficiency and speed
Maximize hardware utilization with parallelism strategies like DualPipe
Apply post-training methods such as supervised fine-tuning and reinforcement learning to unlock reasoning capabilities
Compress and distill large models into smaller, deployable versions for real-world use

In Build a DeepSeek Model (From Scratch) you'll build your own DeepSeek clone from the ground up. First, you'll quickly review LLM fundamentals, with an eye to where DeepSeek's innovations address the common problems and limitations of standard models. Then, you'll learn everything you need to create your own DeepSeek-inspired model, including the innovations that put DeepSeek on the map: Multihead Latent Attention (MLA), Multi-Token Prediction (MTP), Mixture of Experts (MoE), model distillation, and reasoning.

about the book
Build a DeepSeek Model (From Scratch) uses intuitive visualizations, code walkthroughs, and a problem-solution narrative to transform complex concepts into practical skills. You will start by coding a DeepSeekAttention module, progress to building a fully functional MoE layer, and set up a high-efficiency training pipeline. By the end of the book, you will have a fully operational mini-DeepSeek that runs on your laptop, along with the skills to extend and optimize it for your own research or production applications.
search inside this book

about the reader
For intermediate-to-advanced ML engineers, AI researchers, and graduate students who want to go beyond prebuilt models. You'll need to know deep learning and Python programming.

about the authors
Dr. Raj Abhijit Dandekar is a computer scientist and co-founder of Vizuara AI Labs, an online education platform that has trained over 50,000 students globally. He holds a PhD from MIT and is the lead instructor of the popular YouTube series Build DeepSeek from Scratch.

Dr. Rajat Dandekar, PhD in Mechanical Engineering from Purdue University, specializes in applying machine learning to complex physical systems. He co-founded Vizuara AI Labs.

Naman Dwivedi is an AI researcher at Vizuara AI Labs, specializing in turning advanced deep learning concepts into hands-on, practical code.

Dr. Sreedath Pana holds a PhD from MIT and is a co-founder of Vizuara AI Labs. He is an inventor and AI engineer known for creating self-cleaning AI-powered solar technology.

Contents of Download:
Idézet:? Build A DeepSeek Model From Scratch V2 MEAP.epub (Raj Abhijit Dandekar, Rajat Dandekar, Sreedath Panat, Naman Dwivedi) (2025) (19.71 MB)
? Build A DeepSeek Model From Scratch V2 MEAP.pdf (Raj Abhijit Dandekar, Rajat Dandekar, Sreedath Panat, Naman Dwivedi) (22.85 MB)

⋆?- - - - -☽───⛧ ⤝❖⤞ ⛧───☾ - - - -?⋆

⭐️ Build A DeepSeek Model From Scratch MEAP V2 ✅ (43.84 MB)
Uploadgig Link(s)
Idézet:A kódrészlet megtekintéséhez be kell jelentkezned, vagy nincs jogosultságod a tartalom megtekintéséhez.
RapidGator Link(s)
Idézet:A kódrészlet megtekintéséhez be kell jelentkezned, vagy nincs jogosultságod a tartalom megtekintéséhez.

  •
A szerző üzeneteinek keresése
Válaszol


Hasonló témák...
Téma: Szerző Válaszok: Megtekintések: Utolsó üzenet
  Model Based Parameter Estimation In Computational Electromagnetics (Edmund K. Miller;) Farid-Khan 0 39 2026-03-20. 10:59
Utolsó üzenet: Farid-Khan
  Build A Reasoning Model From Scratch MEAP 07 (Sebastian Raschka) Farid-Khan 0 42 2026-03-19. 14:49
Utolsó üzenet: Farid-Khan
  China's 90% Model China Has America By The Throat Here's How To Fight Back And Win (Ram Charan;) Farid-Khan 0 29 2026-03-18. 23:18
Utolsó üzenet: Farid-Khan
  Dynamic Authorization MEAP V05 (Phil Windley) Farid-Khan 0 27 2026-03-18. 23:04
Utolsó üzenet: Farid-Khan
  How To Build And Fine Tune A Small Language Model A Step By Step Guide For Beginners Researchers And Non Programmers (J. Farid-Khan 0 33 2026-03-18. 22:44
Utolsó üzenet: Farid-Khan
  Low Back Pain And Sciatica A New Pathogenetic Model And Treatment Principles True EPUB (Luigi Tesio) Farid-Khan 0 30 2026-03-16. 11:36
Utolsó üzenet: Farid-Khan
  Learn AI Data Engineering In A Month Of Lunches MEAP 05 (David Melillo) Farid-Khan 0 29 2026-03-13. 10:14
Utolsó üzenet: Farid-Khan
  Microservices Patterns Second Edition MEAP V05 (Chris Richardson) Farid-Khan 0 30 2026-03-13. 10:01
Utolsó üzenet: Farid-Khan
  Neurodivergent Somatics In Therapy An Anti Oppressive Model For Whole Person Care (Nyck Walsh, Morénike Giwa Onaiwu) Farid-Khan 0 29 2026-03-13. 09:59
Utolsó üzenet: Farid-Khan
  Model Based Fault Diagnosis And Fault Tolerant Control (2025) (Alia Salah) Farid-Khan 0 32 2026-03-13. 08:28
Utolsó üzenet: Farid-Khan

Digg   Delicious   Reddit   Facebook   Twitter   StumbleUpon  


Jelenlevő felhasználók ebben a témában:
1 Vendég

  •  
  • Vissza a lap tetejére  
  •  Kapcsolat
Design © 2026 Orpheus
MyBB, © 2002-2026 MyBB Group.
Jogi nyilatkozat A fórum szerverén nem található meg a tényleges tartalom, szerzői jog és egyéb jog által védett adatokat, tartalmat nem tárol, csak más weboldalakon elhelyezett tartalomra mutató linkek láthatók. A fórumon előzetes moderáció nélkül bárki hozzászólhat, ezért a fórum tulaja, adminisztrátorai, moderátorai nem vállalnak felelősséget az oldalon elhelyezett anyagok jogszerűségét illetően. A személyiségi valamint szerzői és szomszédos jogokat sértő hozzászólásokat megalapozott indokú kérésre eltávolítjuk az oldalról. admin[kukac]hhwforum.hu
Lineáris
Rétegezett
Megtekintés nyomtatható verzióban
Feliratkozás a témára
Szavazás hozzáadása ehhez a témához
Send thread to a friend