ML2.2.2 PG 之 AC 方法思路和实践
1. 资料 PG 方法基础思路:https://pangruitao.com/post/5164 PG 最基础 … 阅读更多
1. 资料 PG 方法基础思路:https://pangruitao.com/post/5164 PG 最基础 … 阅读更多
1. 资料 PG 方法核心思路:https://pangruitao.com/post/5164 2. REI … 阅读更多
1. 资料 2. 策略梯度PG思路说明 PG 即策略梯度方法(Policy Gradient Methods) … 阅读更多
1. 资料 2. Q Learning 的思路 强化学习的目标是:获得一个智能体 Agent ,当把环境信息告 … 阅读更多
1. 资料 2. 说明 强化学习的目标是获得一个智能体 Agent ,当把环境信息告知 Agent 以后,Ag … 阅读更多
0. 资料 1. 实践和实现 GPT 详见 ML1:https://pangruitao.com/post/4 … 阅读更多
1. 说明 完整路径 2. Jupyter Notebook gpt_with_tokenizer In [1 … 阅读更多
1. 说明 跟 Andrej 大佬学 GPT Tokenizer 2. Jupyter Notebook to … 阅读更多
1. 说明 跟 Andrej 大佬的教程实现的极简版 GPT,可以实现续写文章(最后有运行效果)。 2. Ju … 阅读更多
1. 说明 GPT 模型学习的一步 根据 Andrej Karpathy 大佬的课程视频实践得到 2. Jup … 阅读更多
Jupyter Notebook simple_fcnn In [7]: import torch impor … 阅读更多