当前位置:首页|资讯|机器学习|深度学习|编程

这份Trick指南太强了

作者:啥都会一点的研究生发布时间:2023-07-19

网上冲浪时发现的一份涵盖机器学习、深度学习、数学、数据分析、Python编程、甚至Jupyter等等,共200+ tips的“Trick Book”

大致浏览了内容,制作还是相当用心的,示例搭配图解,主打简约通俗易懂

无论是丰富野生技能还是扩充面经都不错

https://www.blog.dailydoseofds.com/p/free-daily-dose-of-data-science-pdf

出不去的/懒的:公众号【啥都会一点的研究生】后台回复【trickbook】

部分内容展示


部分目录

机器学习算法是否都依赖于梯度下降?(9)

为什么Sklearn的线性回归没有超参数?(11)

使用Jupyter DataTables丰富Pandas DataFrame的默认预览。(13) 

通过这个简单的图形可视化线性回归的性能。(14) 

通过这个简单的技巧使热图更丰富。(16) 

置信区间和预测区间不是相同的概念。(17) 

机器学习中性能指标的终极分类。(19) 

用最酷的Matplotlib技巧直观地创建子图。(23) 

将Python项目目录作为脚本执行。(25) 

单热编码中最常被忽视的问题。(26) 

数据科学中最重要的9个图表。(28) 

在训练机器学习模型之前,分类特征编码是否总是必要的?(30)

Scikit-LLM:将Sklearn API与大型语言模型集成。(33) 

训练准确度和训练损失的反直觉行为。(34)

 Sigmoid函数实现中一个常被忽视的要点。(38)

 聚类算法的终极分类。(41)

 在不改变任何代码的情况下改进Python运行时间。(43)

 Pandas合并方法中一个不太为人知的特性。(45) 

最酷的GitHub-Colab集成,你会惊叹不已。(47) 

大多数Sklearn用户对其LinearRegression实现的这个问题不了解。(48) 

使用Stickyland打破笔记本的线性呈现方式。(50)

 通过这个简单的图形可视化任何线性回归模型的性能。(51)

 瀑布图:一种更好的替代线条/柱形图的方式。(53)

 Google样式指南对导入的要求是什么?(54)

 如何真正使用训练集、验证集和测试集?(56)

 在不丢失变量的情况下重新启动Jupyter内核。(59)

 在使用PCA之前需要考虑的优缺点。(60) 

损失函数:一个按算法分类的全面总结。(62) 

在训练机器学习模型之前,数据归一化总是必要的吗?(64)

 使用Pigeon按钮注释数据。(67)

 用Sankey图丰富混淆矩阵。(68) 

随机梯度下降、小批量梯度下降和批量梯度下降的可视化指南。(70) 

for循环和列表推导之间一个不太为人知的区别。(73)

 PCA的一个常被忽视的限制。(75) 

魔术方法:Python面向对象编程中一个被低估的亮点。(78) 

许多人不屑于记住的回归算法分类。(81) 

分析Pandas DataFrame时一个高度被忽视的方法。(83)

 用Bump Charts可视化随时间的排名变化。(84)

 使用这个简单的技巧永远不必再为TP、TN、FP和FN而努力。(85)

 关于Pandas中原位操作最常见的误解。(87) 

用Mercury在Jupyter Notebook中构建优雅的Web应用程序。(89)

 用Pandas转SQL实现成为双语数据科学家。(91) 

Sklearn的一个不太为人知的特性,用于在大型数据集上训练模型。(93)

 用一行代码创建专业外观的Matplotlib图形。(95) 

在索引DataFrame时避免这个代价高昂的错误。(97)

用更灵活的方式运行Python脚本的9个命令行标志。(100)

KMeans呼吸法:比KMeans更好、更快的替代方法(102) 

在使用PCA时,应该将数据降到多少维?(105) 

Mito刚刚通过AI加速了!(108) 

在使用总结统计数据之前,要谨慎得出任何结论(110)

 在布尔上下文中使用自定义的Python对象(112) 

机器学习中抽样技术的可视化指南(114)

 你可能对元组的不可变性得到了不完整的信息(118)

一个简单的技巧,显著提高Matplotlib图的质量(120) 

PCA的视觉和过于简化的指南(122) 

用ipyflow强化你的Jupyter内核(125)

 使用Plotly创建图形的一个鲜为人知的特性(127) 

欧氏距离的局限性,许多人经常忽视(129)

 可视化正则化参数的影响(132)

 AutoProfiler:在你工作时自动分析你的DataFrame(134)

 一点额外的努力可以极大地改变你的讲故事技巧(136) 

Python中一个让许多程序员不知道的隐含功能(138)

 通过Sankey图交互地可视化决策树(141) 

小心使用直方图。它们是非常误导性的!(143)

 三种简单的方法(即时)让你的散点图整洁无杂乱(145)

 在下次使用KMeans之前需要考虑的(非常)重要的一点(148)

 为什么你应该避免向DataFrame添加行(151)

 Matplotlib有许多隐藏的宝石。这是其中之一(153) 

关于Python字典的一个违反直觉的事情(155)

 执行Python代码的可能是最快的方法(158) 

你确定你正在使用正确的Pandas术语吗?(160)

类不平衡问题总是一个大问题需要解决吗?(163)

 一个简单的技巧,使热图更加优雅(165)

 局部聚类和密度聚类的可视化对比(167) 

为什么我们不称之为逻辑分类而不是逻辑回归?(168)

 关于决策树的一个典型问题,许多人经常忽视(170)

 在使用线性回归之前始终验证输出变量(171)

 关于Python函数的一个违反直觉的事实(172)

 为什么在训练机器学习模型之前对数据集进行洗牌很重要?(173)

 热图的限制正在拖慢你的数据分析(174)

 皮尔逊相关性的限制,许多人经常忽视(175)

 为什么我们通常建议设置随机生成器的种子?(176) 

一个被低估的提高数据可视化的技巧(177)

 在Jupyter Notebook中创建图表和透视表的无代码工具(178) 

如果你无法编写矢量化的方法,可以尝试这个(179) 

为什么我们通常建议不要迭代DataFrame?(181) 

在Python中操纵可变对象有时会让人困惑(182)

 这个小调整可以显著提升KMeans的运行时间(184) 

大多数Python程序员不知道关于Python面向对象编程的这个问题(186)

 谁说Matplotlib不能创建交互式图形?(188)

 不要创建混乱的条形图,而是尝试气泡图!(189) 

你可以将列表添加为字典的键(技术上可以)!(190) 

许多人在使用线性回归时经常忽视这一点(191)

 35个隐藏的Python库,它们是绝对的宝藏(192) 

小心使用箱形图!它们可能会误导你(193) 

创建更好的数据图的一个被低估的技巧(194) 

每个数据科学家一直在等待的Pandas DataFrame扩展(195)

 使用Xonsh用Python增强Shell(196) 

大多数命令行用户不知道关于使用终端的这个酷技巧(197) 

一个简单的技巧,充分利用Pandas中的透视表(198) 

为什么Python不提供真正的面向对象封装?(199) 

在使用Pandas读取CSV时,再也不必担心解析错误(200)

使用Pandas创建图表的有趣而鲜为人知的方法(201)

 大多数Python程序员对Python for循环不知情(202)

 如何在Python中启用函数重载(203)

 编写Pandas代码时生成有用的提示(204)

 使用Bottleneck将NumPy方法加速25倍(205)

可视化神经网络的数据转换(206) 

不再手动重构代码,而是使用Sourcery!(207)

 在几秒钟内绘制你正在寻找的数据(208) 

为了使Matplotlib图更具吸引力而进行样式设置(209) 

将Pandas的Parquet I/O加速5倍(210) 

40个开源工具,为你的Pandas工作流提速(211)

 停止使用Pandas的describe方法。改用Skimpy(212) 

以正确的方式升级Python库(213) 

使用Sklearn一行代码预览决策树(214) 

停止使用Pandas的describe方法。改用Summarytools(215) 

再也不用手动搜索Jupyter笔记本以找到你的代码了(216) 

f-strings比你想象的更加多功能(217)

 这是有史以来最好的KMeans动画指南吗?(218) 

改善模型性能的有效但被低估的技术(219) 

直接从终端创建数据图(220) 

使你的Matplotlib图更专业(221) 

37个隐藏的Python库,它们是绝对的宝藏(222) 


Copyright © 2025 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1