这份Trick指南太强了

作者：啥都会一点的研究生发布时间：2023-07-19

机器学习深度学习编程

网上冲浪时发现的一份涵盖机器学习、深度学习、数学、数据分析、Python编程、甚至Jupyter等等，共200+ tips的“Trick Book”

大致浏览了内容，制作还是相当用心的，示例搭配图解，主打简约通俗易懂

无论是丰富野生技能还是扩充面经都不错

https://www.blog.dailydoseofds.com/p/free-daily-dose-of-data-science-pdf

出不去的/懒的：公众号【啥都会一点的研究生】后台回复【trickbook】

部分内容展示

部分目录

机器学习算法是否都依赖于梯度下降？（9）

为什么Sklearn的线性回归没有超参数？（11）

使用Jupyter DataTables丰富Pandas DataFrame的默认预览。（13）

通过这个简单的图形可视化线性回归的性能。（14）

通过这个简单的技巧使热图更丰富。（16）

置信区间和预测区间不是相同的概念。（17）

机器学习中性能指标的终极分类。（19）

用最酷的Matplotlib技巧直观地创建子图。（23）

将Python项目目录作为脚本执行。（25）

单热编码中最常被忽视的问题。（26）

数据科学中最重要的9个图表。（28）

在训练机器学习模型之前，分类特征编码是否总是必要的？（30）

Scikit-LLM：将Sklearn API与大型语言模型集成。（33）

训练准确度和训练损失的反直觉行为。（34）

Sigmoid函数实现中一个常被忽视的要点。（38）

聚类算法的终极分类。（41）

在不改变任何代码的情况下改进Python运行时间。（43）

Pandas合并方法中一个不太为人知的特性。（45）

最酷的GitHub-Colab集成，你会惊叹不已。（47）

大多数Sklearn用户对其LinearRegression实现的这个问题不了解。（48）

使用Stickyland打破笔记本的线性呈现方式。（50）

通过这个简单的图形可视化任何线性回归模型的性能。（51）

瀑布图：一种更好的替代线条/柱形图的方式。（53）

Google样式指南对导入的要求是什么？（54）

如何真正使用训练集、验证集和测试集？（56）

在不丢失变量的情况下重新启动Jupyter内核。（59）

在使用PCA之前需要考虑的优缺点。（60）

损失函数：一个按算法分类的全面总结。（62）

在训练机器学习模型之前，数据归一化总是必要的吗？（64）

使用Pigeon按钮注释数据。（67）

用Sankey图丰富混淆矩阵。（68）

随机梯度下降、小批量梯度下降和批量梯度下降的可视化指南。（70）

for循环和列表推导之间一个不太为人知的区别。（73）

PCA的一个常被忽视的限制。（75）

魔术方法：Python面向对象编程中一个被低估的亮点。（78）

许多人不屑于记住的回归算法分类。（81）

分析Pandas DataFrame时一个高度被忽视的方法。（83）

用Bump Charts可视化随时间的排名变化。（84）

使用这个简单的技巧永远不必再为TP、TN、FP和FN而努力。（85）

关于Pandas中原位操作最常见的误解。（87）

用Mercury在Jupyter Notebook中构建优雅的Web应用程序。（89）

用Pandas转SQL实现成为双语数据科学家。（91）

Sklearn的一个不太为人知的特性，用于在大型数据集上训练模型。（93）

用一行代码创建专业外观的Matplotlib图形。（95）

在索引DataFrame时避免这个代价高昂的错误。（97）

用更灵活的方式运行Python脚本的9个命令行标志。（100）

KMeans呼吸法：比KMeans更好、更快的替代方法（102）

在使用PCA时，应该将数据降到多少维？（105）

Mito刚刚通过AI加速了！（108）

在使用总结统计数据之前，要谨慎得出任何结论（110）

在布尔上下文中使用自定义的Python对象（112）

机器学习中抽样技术的可视化指南（114）

你可能对元组的不可变性得到了不完整的信息（118）

一个简单的技巧，显著提高Matplotlib图的质量（120）

PCA的视觉和过于简化的指南（122）

用ipyflow强化你的Jupyter内核（125）

使用Plotly创建图形的一个鲜为人知的特性（127）

欧氏距离的局限性，许多人经常忽视（129）

可视化正则化参数的影响（132）

AutoProfiler：在你工作时自动分析你的DataFrame（134）

一点额外的努力可以极大地改变你的讲故事技巧（136）

Python中一个让许多程序员不知道的隐含功能（138）

通过Sankey图交互地可视化决策树（141）

小心使用直方图。它们是非常误导性的！（143）

三种简单的方法（即时）让你的散点图整洁无杂乱（145）

在下次使用KMeans之前需要考虑的（非常）重要的一点（148）

为什么你应该避免向DataFrame添加行（151）

Matplotlib有许多隐藏的宝石。这是其中之一（153）

关于Python字典的一个违反直觉的事情（155）

执行Python代码的可能是最快的方法（158）

你确定你正在使用正确的Pandas术语吗？（160）

类不平衡问题总是一个大问题需要解决吗？（163）

一个简单的技巧，使热图更加优雅（165）

局部聚类和密度聚类的可视化对比（167）

为什么我们不称之为逻辑分类而不是逻辑回归？（168）

关于决策树的一个典型问题，许多人经常忽视（170）

在使用线性回归之前始终验证输出变量（171）

关于Python函数的一个违反直觉的事实（172）

为什么在训练机器学习模型之前对数据集进行洗牌很重要？（173）

热图的限制正在拖慢你的数据分析（174）

皮尔逊相关性的限制，许多人经常忽视（175）

为什么我们通常建议设置随机生成器的种子？（176）

一个被低估的提高数据可视化的技巧（177）

在Jupyter Notebook中创建图表和透视表的无代码工具（178）

如果你无法编写矢量化的方法，可以尝试这个（179）

为什么我们通常建议不要迭代DataFrame？（181）

在Python中操纵可变对象有时会让人困惑（182）

这个小调整可以显著提升KMeans的运行时间（184）

大多数Python程序员不知道关于Python面向对象编程的这个问题（186）

谁说Matplotlib不能创建交互式图形？（188）

不要创建混乱的条形图，而是尝试气泡图！（189）

你可以将列表添加为字典的键（技术上可以）！（190）

许多人在使用线性回归时经常忽视这一点（191）

35个隐藏的Python库，它们是绝对的宝藏（192）

小心使用箱形图！它们可能会误导你（193）

创建更好的数据图的一个被低估的技巧（194）

每个数据科学家一直在等待的Pandas DataFrame扩展（195）

使用Xonsh用Python增强Shell（196）

大多数命令行用户不知道关于使用终端的这个酷技巧（197）

一个简单的技巧，充分利用Pandas中的透视表（198）

为什么Python不提供真正的面向对象封装？（199）

在使用Pandas读取CSV时，再也不必担心解析错误（200）

使用Pandas创建图表的有趣而鲜为人知的方法（201）

大多数Python程序员对Python for循环不知情（202）

如何在Python中启用函数重载（203）

编写Pandas代码时生成有用的提示（204）

使用Bottleneck将NumPy方法加速25倍（205）

可视化神经网络的数据转换（206）

不再手动重构代码，而是使用Sourcery！（207）

在几秒钟内绘制你正在寻找的数据（208）

为了使Matplotlib图更具吸引力而进行样式设置（209）

将Pandas的Parquet I/O加速5倍（210）

40个开源工具，为你的Pandas工作流提速（211）

停止使用Pandas的describe方法。改用Skimpy（212）

以正确的方式升级Python库（213）

使用Sklearn一行代码预览决策树（214）

停止使用Pandas的describe方法。改用Summarytools（215）

再也不用手动搜索Jupyter笔记本以找到你的代码了（216）

f-strings比你想象的更加多功能（217）

这是有史以来最好的KMeans动画指南吗？（218）

改善模型性能的有效但被低估的技术（219）

直接从终端创建数据图（220）

使你的Matplotlib图更专业（221）

37个隐藏的Python库，它们是绝对的宝藏（222）

近期资讯

沂蒙霞客行请问天体物理学家，这是什么现象？

这是什么现象？红色光晕里的太阳是怎么出来的？金碧辉煌的夕阳，落在杨树林的尽头，投射出一枚小小的红碗，碗底里沉着一枚小小的太阳。

沂蒙霞客 2024-12-31

2025新送礼新潮流！微信“送礼物”上线，罗莱零压深睡枕成新年的“头”一份礼物

如今，微信小店“送礼物”功能的创新推出，将购物与社交完美融合，为用户带来了前所未有的便捷送礼新体验。通过“送给朋友”功能，用户可以轻松挑选出心仪的商品，将礼物与祝福一并发送给好友。

极目新闻 2024-12-31

三门德鑫机械取得带轮安装架结构专利，降低带轮安装架的成本

金融界2024年12月31日消息，国家知识产权局信息显示，三门德鑫机械有限公司取得一项名为“一种带轮安装架结构”的专利，授权公告号CN222226807U，申请日期为2024年4月。

金融界 2024-12-31

南岸区城市管理局：安装灯控神器，城市智慧照明再升级

近日，为进一步打造宜居、韧性、智慧城市，南岸区城市管理局在城市照明上下功夫，在城市道路照明绿色节能改造的基础上，安装路灯单灯控制器，接入城市智慧照明管理系统，让南岸道路照明管理更加精细化、规范化和智能化。

上游新闻 2024-12-31

告别2024：倾听、反思和追问的力量

中国新闻周刊 2024-12-31

罗技ERGO M575 S鼠标首发269元：配备无线轨迹球

快科技12月31日消息，罗技ERGOM575S鼠标目前已经上市，首发269元。据介绍，罗技ERGOM575S由罗技ErgoLab的专家开发研制，经过用户测试及人体工程学专家认证，可让用户在整日的工作中保持手部和前臂放松。ERGOM575S较传统对称造型的SignatureM650可减少25%的前臂肌肉劳损。

驱动之家 2024-12-31

工信部：2027年实现清洁氢在冶金、氨醇、炼化等实现规模化应用

为落实《氢能产业发展中长期规划（2021—2035年）》,积极拓展清洁低碳氢在工业领域应用，加快技术装备产品升级，促进氢能产业高质量发展，工业和信息化部、国家发展改革委、国家能源局于2024年12月30日联合发布实施《加快工业领域清洁低碳氢应用实施方案》（工信厅联节函〔2024〕499号，以下简称《实施方案》）。

氢云链 2024-12-31

北京日报 2024-12-31

这份Trick指南太强了

推荐体验

相关资讯

chatgpt具体案例真的太强了

OpenAI上线新功能太强了，服务器瞬间被挤爆

深度学习特征提取魔改版太强了！发文香饽饽！

AI时代，你急需这份AIGC指南

无界版图AI太强了！通用模型增强版你还没用？

近期资讯

沂蒙霞客行请问天体物理学家，这是什么现象？

2025新送礼新潮流！微信“送礼物”上线，罗莱零压深睡枕成新年的“头”一份礼物

三门德鑫机械取得带轮安装架结构专利，降低带轮安装架的成本

南岸区城市管理局：安装灯控神器，城市智慧照明再升级

告别2024：倾听、反思和追问的力量

罗技ERGO M575 S鼠标首发269元：配备无线轨迹球

工信部：2027年实现清洁氢在冶金、氨醇、炼化等实现规模化应用

业界在京探讨AI技术赋能企业品牌宣传

智云健康接连斩获多项省级荣誉

八台跨年晚会各显神通，谁将称霸收视？

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响