跳至内容

PP's Blog

A Sharing Notebook

  • 最新内容
  • 精选内容

机器学习

ML2.2.2 PG 之 PPO 算法思路和实践

2025年3月1日2024年11月24日 作者 PP

1. 资料 PG 方法核心思路:https://pangruitao.com/post/5164 2. PPO … 阅读更多

分类 学习笔记、 折腾记录 标签 Python、 机器学习 发表评论

ML2.2.2 PG 之 AC 方法思路和实践

2025年3月1日2024年11月11日 作者 PP

1. 资料 PG 方法基础思路:https://pangruitao.com/post/5164 PG 最基础 … 阅读更多

分类 思考总结、 学习笔记、 折腾记录 标签 Python、 机器学习 发表评论

ML2.2.1 PG 之 REINFORCE 方法思路和实践

2025年3月1日2024年11月11日 作者 PP

1. 资料 PG 方法核心思路: 2. REINFORCE 思路 REINFORCE 就基本按照 PG 的核心 … 阅读更多

分类 学习笔记、 折腾记录 标签 Python、 机器学习 发表评论

ML2.2 策略梯度PG的学习和实践

2025年3月1日2024年11月9日 作者 PP

1. 资料 2. 策略梯度PG思路说明 PG 即策略梯度方法(Policy Gradient Methods) … 阅读更多

分类 精选内容、 学习笔记、 折腾记录 标签 Python、 机器学习 发表评论

ML2.1 DQL 学习和实践

2025年3月1日2024年11月5日 作者 PP

1. 资料 2. Q Learning 的思路 强化学习的目标是:获得一个智能体 Agent ,当把环境信息告 … 阅读更多

分类 精选内容、 学习笔记、 折腾记录 标签 Python、 机器学习 发表评论

ML2.0 强化学习笔记汇总

2025年3月1日2024年11月5日 作者 PP

1. 资料 2. 说明 强化学习的目标是获得一个智能体 Agent ,当把环境信息告知 Agent 以后,Ag … 阅读更多

分类 精选内容、 学习笔记 标签 Python、 机器学习 发表评论

ML0.0 机器学习笔记汇总

2025年3月1日2024年10月28日 作者 PP

0. 资料 1. 实践和实现 GPT 详见 ML 1.0 2. 强化学习 详见 ML 2.0 相关文章 ML2 … 阅读更多

分类 精选内容、 学习笔记 标签 Python、 机器学习 发表评论

ML1.6 实现 GPT 并结合 Tokenizer

2025年3月1日2024年10月15日 作者 PP

1. 说明 完整路径 2. Jupyter Notebook gpt_with_tokenizer In [1 … 阅读更多

分类 思考总结、 学习笔记、 折腾记录 标签 机器学习、 Python 发表评论

ML1.5 实现 GPT 的 tokenizer

2025年3月1日2024年10月15日 作者 PP

1. 说明 跟 Andrej 大佬学 GPT Tokenizer 2. Jupyter Notebook to … 阅读更多

分类 学习笔记、 折腾记录 标签 Python、 机器学习 发表评论

ML1.4 pytorch 实现极简版 GPT

2025年3月1日2024年10月14日 作者 PP

1. 说明 跟 Andrej 大佬的教程实现的极简版 GPT,可以实现续写文章(最后有运行效果)。 2. Ju … 阅读更多

分类 学习笔记、 折腾记录 标签 数学、 Python、 机器学习 发表评论

ML1.0 一步步学习和实现 GPT

2024年11月6日2024年10月13日 作者 PP

1. 说明 文章作为个人学习 GPT 的笔记。 1.1 学习资料 不得不说现在的互联网还是给像我这样的普通人提 … 阅读更多

分类 精选内容、 学习笔记、 折腾记录 标签 数学、 Python、 机器学习 发表评论

ML1.3 Self-Attention 的基础数学思路

2025年3月1日2024年10月11日 作者 PP

1. 说明 GPT 模型学习的一步 根据 Andrej Karpathy 大佬的课程视频实践得到 2. Jup … 阅读更多

分类 学习笔记、 折腾记录 标签 数学、 Python、 机器学习 发表评论

ML1.2 pytorch 实现 bigram 模型

2024年11月6日2024年10月11日 作者 PP

1. 说明 参考 Andrej Karpathy 的 Let’s Build GPT 讲解视频 个 … 阅读更多

分类 学习笔记、 折腾记录 标签 数学、 机器学习、 Python 发表评论

ML1.1 pytorch 实现简单的全连接神经网络

2025年3月1日2024年10月10日 作者 PP

Jupyter Notebook simple_fcnn In [7]: import torch impor … 阅读更多

分类 学习笔记、 折腾记录 标签 机器学习、 Python 发表评论

搜索

文章分类

  • 分享输出 (44)
    • 精选内容 (44)
  • 整理记录 (163)
    • 思考总结 (20)
    • 学习笔记 (99)
    • 折腾记录 (62)
    • 读书笔记 (4)
    • 游戏设计 (9)
  • 零散资料 (21)

标签云

C语言 Debian Docker Linux Nginx Python Wordpress 历史 哲学 图形学 数学 服务器 机器学习 概率论 游戏 算法 计算机 设计 逻辑学 麻将

最新文章

  • 福柯-学习笔记
  • 法国大革命前后重要事件整理
  • AMH8 小亚细亚简史-土耳其
  • AMH7 小亚细亚简史-奥斯曼
  • AMH6 小亚细亚简史-罗马
  • AMH5 小亚细亚简史-希腊时期
  • AMH4 小亚细亚简史-波斯
  • AMH3 小亚细亚简史-吕底亚
  • AMH2 小亚细亚简史-赫梯
  • AMH1 小亚细亚简史
  • 伊斯兰哈里发等头衔的含义
  • WordPress当笔记App的体验
  • WordPress 卡片样式 CSS
  • Palworld Loop 帕鲁体验引擎分析
  • WordPress 禁用图片自动裁剪
  • ML2.2.2 PG 之 PPO 算法思路和实践
  • ML2.2.2 PG 之 AC 方法思路和实践
  • ML2.2.1 PG 之 REINFORCE 方法思路和实践
  • ML2.2 策略梯度PG的学习和实践
  • ML2.1 DQL 学习和实践
  • ML2.0 强化学习笔记汇总
  • ML0.0 机器学习笔记汇总
  • ML1.6 实现 GPT 并结合 Tokenizer
  • ML1.5 实现 GPT 的 tokenizer
  • ML1.4 pytorch 实现极简版 GPT
  • ML1.0 一步步学习和实现 GPT
  • ML1.3 Self-Attention 的基础数学思路
  • ML1.2 pytorch 实现 bigram 模型
  • ML1.1 pytorch 实现简单的全连接神经网络
  • Windows 11 安装 OpenSSH Server
  • Windows 下部署 CUDA 和 pytorch 环境
  • 使用 python 暴力破解 zip 密码
  • Nginx 配合 acme.sh 申请 ssl 证书并部署和自动续期
  • 量子力学自学笔记
  • Python 实现年级排课和优化-说明
  • Python 实现年级排课和优化-代码
  • Linux 下 Github 基本操作
  • python飞书机器人拉群聊历史消息
  • 四川麻将学习笔记4.2-算牌-精算
  • 四川麻将学习笔记2.4 几种重要的一上听牌型
  • Windows下Github基本操作
  • 使用公钥无密码连接ssh
  • Linux 下用 docker 搭建帕鲁服务器
  • python 实现飞书机器人-大模型版
  • python 实现飞书机器人-随机回复版
  • 四川麻将学习笔记4.1-算牌-粗算
  • 四川麻将学习笔记3.1-局势把握
  • 四川麻将学习笔记2.3-五搭牌原理
  • 四川麻将学习笔记2.2-熟悉搭子
  • 四川麻将学习笔记1-目录
  • 四川麻将学习笔记2.1-基础手牌看叫
  • 一阶二阶高阶形式逻辑系统
  • Coursera NLP:C1_W1_Assignment
  • Win10开启启动内容管理
  • Python实现网页版德州扑克游戏
  • 饥荒linux服务器搭建教程
  • Docker安装教程
  • Docker基础操作
  • 德州扑克计算器网页版Python实现
  • Docker搭建带Jupyterlab并带SSL和密码

归档

  • 2025 年 5 月 (1)
  • 2025 年 4 月 (6)
  • 2025 年 3 月 (6)
  • 2025 年 2 月 (2)
  • 2024 年 11 月 (6)
  • 2024 年 10 月 (8)
  • 2024 年 9 月 (7)
  • 2024 年 7 月 (1)
  • 2024 年 3 月 (4)
  • 2024 年 2 月 (1)
  • 2024 年 1 月 (1)
  • 2023 年 12 月 (3)
  • 2023 年 11 月 (1)
  • 2023 年 9 月 (4)
  • 2023 年 8 月 (1)
  • 2023 年 3 月 (2)
  • 2022 年 12 月 (4)
  • 2022 年 11 月 (1)
  • 2022 年 10 月 (3)
  • 2022 年 9 月 (1)
  • 2022 年 8 月 (1)
  • 2022 年 7 月 (1)
  • 2022 年 6 月 (4)
  • 2022 年 5 月 (1)
  • 2022 年 4 月 (1)
  • 2022 年 3 月 (3)
  • 2021 年 9 月 (1)
  • 2021 年 8 月 (2)
  • 2021 年 6 月 (1)
  • 2021 年 4 月 (1)
  • 2021 年 3 月 (9)
  • 2021 年 2 月 (10)
  • 2021 年 1 月 (6)
  • 2020 年 12 月 (9)
  • 2020 年 11 月 (8)
  • 2020 年 10 月 (15)
  • 2020 年 9 月 (38)
  • 2020 年 8 月 (5)
  • 2020 年 7 月 (1)
  • 2020 年 6 月 (2)
  • 2020 年 4 月 (1)

文章分类

  • 分享输出 (44)
    • 精选内容 (44)
  • 整理记录 (163)
    • 思考总结 (20)
    • 学习笔记 (99)
    • 折腾记录 (62)
    • 读书笔记 (4)
    • 游戏设计 (9)
  • 零散资料 (21)

蜀ICP备20012765号-2

© 2025 PP's Blog • Built with GeneratePress