机器学习算法与Python实战

其他

【机器学习】数据维度爆炸怎么办?详解5大常用的特征选择方法

Correlation速度快、易于计算,经常在拿到数据(经过清洗和特征提取之后的)之后第一时间就执行。Scipy的pearsonr方法能够同时计算相关系数和p-value,import
1月22日 上午 11:22
其他

吴恩达最新短课,知识很硬核,附中英字幕

管道的性能提高到基线以上。自动合并检索,将文档组织成分层树结构,其中每个父节点的文本在其子节点之间分割。根据子节点与用户查询的相关性,这可以让您更好地决定是否应将整个父节点作为上下文提供给
2023年12月8日
其他

多模态机器学习,120页PPT,下载

第二版》PDF下载可能是全网最全的速查表:Python机器学习ChatGPT线性代数微积分概率统计微软真是活菩萨,面向初学者的机器学习、数据科学、AI、LLM课程统统免费
2023年12月7日
其他

我最喜欢的白版应用,AI加持的新功能开源!强烈推荐

我是老章Excalidraw是我最喜欢的一个虚拟白板应用,专门用于绘制类似手绘的图表。它提供了一个无限的、基于画布的白板,具有手绘风格,支持多种功能。之前我分享的:72张PNG,图解机器学习
2023年12月6日
其他

Keras 3.0正式发布!一统TF/PyTorch/Jax三大后端框架!

Chollet认为,这样至少可以获得4大好处:始终让模型获得最佳性能:JAX通常在GPU、CPU各种PU上都最快,但不使用XLA(加速线性代数)的Tensorflow在GPU上偶尔更快。Keras
2023年12月2日
其他

微软真是活菩萨,面向初学者的机器学习、数据科学、AI、LLM课程统统免费

(@sketchthedocs)地址:https://microsoft.github.io/Data-Science-For-Beginners/#/为期
2023年11月29日
其他

《Scikit-Learn Cookbook 第二版》PDF下载

和分类器、回归器和估计器等新功能外,本书还包含评估和微调模型性能的秘诀。此外,本书提供完整的python代码,链接在书中列出!目录第一章,高性能机器学习
2023年11月27日
其他

吴恩达新课,1.25倍速刷完了

大家好,我是老章吴恩达老师又出新课了:《Generative
2023年11月3日
其他

数据分析入门:统计学基础知识总结

JR们好,这是我校友兄弟写的一篇文章。他经济学硕士成功转行数据分析,前期和面试准备的很充分。所以我邀请他写个专栏,框架搭好后刚写了几篇就入职了,工作太忙就没空再写了。本文是技能需求篇《统计学基础知识》,付费阅读,收费5元苹果用户可以加我微信,直接转账,就不用给库克手续费了下图就是他找工作时期的知识储备,也是原计划要的课程框架,不写完还真可惜了。课程框架统计学基础导读这部分开始,我们就开始正式介入数据分析师的一些基础知识的学习。在这里,我们本章节先从统计学基础开始。
2023年10月21日
其他

PyTorch那些事儿(十九):深度学习实战项目——垃圾分类

ax=ax[1])axesSub.set_title('Height')100%|██████████████████████████████████████████████████|
2023年10月8日
其他

PyTorch那些事儿(十八):深度学习CIFAR10图像分类实战

https://pan.baidu.com/s/1hjy_L_K1Ez0cMNcf3qIUxQ?pwd=bwjt进行下载,然后拷贝到下方root参数指定的目录中。trainset
2023年10月7日
其他

PyTorch那些事儿(十七):深度学习预训练模型

加载预训练的模型和权重参数在后续使用预训练模型时,我们可以根据具体需求选择合适的版本权重。使用这些版本权重时,可以通过将其传递给模型的weights参数来加载相应的预训练权重。如下所示:from
2023年10月6日
其他

PyTorch那些事儿(十六):迁移学习实例

预计阅读时间:
2023年10月5日
其他

PyTorch那些事儿(十五):深度学习模型保存与加载

模型保存训练深度学习模型时,最重要的部分是模型的状态。这里说的状态既包括模型的参数,例如模型各层的权重和偏置,也包括优化器的状态,例如移动平局、动量等信息。在
2023年10月4日
其他

​PyTorch那些事儿(十四):深度学习训练过程可视化

开启TensorBoard的WEB应用在通过上述命令完成tensorboard的安装后,即可在命令行调用tensorboard进行启动。如下所示:tensorboard
2023年10月3日
其他

PyTorch那些事儿(十三):深度学习模型训练过程

是我们本次使用的蚂蚁蜜蜂分类图像数据集存放的目录,其中包含所有需要使用的图像。这个目录的名称不重要,当然,见名知意就好。在
2023年10月2日
其他

PyTorch那些事儿(十二):深度学习模型评估指标

Lightning是一个轻量级的PyTorch包装器,用于更简洁地组织PyTorch代码,同时不牺牲任何灵活性。PyTorch
2023年10月1日
其他

PyTorch那些事儿(十一):超参数调优

Parameters):正则化是用来防止过拟合的一种技术。常见的正则化技术有L1和L2正则化、Dropout等。激活函数(Activation
2023年9月30日
其他

PyTorch那些事儿(十):深度学习中的损失函数

损失函数基本概念在深入了解PyTorch中的损失函数之前,我们首先来回顾一下损失函数的基本概念。这一章节将介绍损失函数的定义、作用以及与优化器之间的关系。损失函数(Loss
2023年9月29日
其他

PyTorch那些事儿(九):优化器

深度学习优化器基础在深入了解PyTorch优化器之前,我们首先需要了解一些深度学习优化器的基本概念。本节将简要介绍梯度下降法、不同类型的梯度下降方法以及学习率的重要性和调整策略。2.1
2023年9月28日
其他

Jupyter Lab 十大高效生产力插件!

https://blog.jupyter.org/a-visual-debugger-for-jupyter-914e61716559[2]JupyterLab-TOC
2023年9月28日
其他

PyTorch那些事儿(八):PyTorch定义好的那些层

是输出张量。线性层的目的是学习输入到输出之间的最佳线性映射,通过调整权重矩阵
2023年9月25日
其他

PyTorch那些事儿(七):深入解析nn.modules

torch.randn(4)sample_inputOut:tensor([-0.1949,
2023年9月24日
其他

PyTorch那些事儿(六):那些预定义的数据集

函数获取数据集的大小。需要注意的是,虽然所有的预定义数据集类都具有上述的公共参数和方法,但是它们也可能有一些自己独特的参数和方法。比如,torchvision.datasets.MNIST
2023年9月23日
其他

PyTorch那些事儿(五):Transforms—图像处理与增强

仿射变换。可以从不同视角获取图像,增强模型对视角变化的鲁棒性。RandomRotation随机旋转图像。RandomAffine进行随机仿射变换。RandomPerspective进行透视变换。5.
2023年9月22日
其他

PyTorch那些事儿(四):DataLoader与Dataset

PyTorch从入门到项目实践PyTorch那些事儿(一):深度学习环境搭建PyTorch那些事儿(二):PyTorch建模示例PyTorch那些事儿(三):Tensor深度解析构建数据集,进行数据预处理的代码会因为处理过程繁杂而变得混乱且难以维护,在理想情况下,我们希望数据预处理过程代码与我们的模型训练代码分离,以获得更好的可读性和模块化,为此,PyTorch提供了torch.utils.data.DataLoader
2023年9月21日
其他

PyTorch那些事儿(三):Tensor深度解析

PyTorch那些事儿(一):深度学习环境搭建PyTorch那些事儿(二):PyTorch建模示例通过上一篇建模流程的介绍,我们知道,数据准备是整个建模过程的开端,数据的质量和准备程度直接影响模型的训练效果和预测精度,有经验的数据工程师都知道,数据准备阶段工作是否完善,决定了我们整个建模性能的天花板,后续的模型搭建与优化只是去不断逼近这个天花板的过程。所以,我们这个PyTorch教程,就从如何使用PyTorch进行数据准备开始。数据准备阶段包括数据的读取、预处理、划分和转换等步骤。在后续章节中,我们将一一介绍这些过程。在本节内容中,我们将对PyTorch中的核心数据结构——Tensor进行深入介绍。不要疑惑,之所以不直接进入正题去介绍如何使用PyTorch准备数据,因为Tensor太重要了,是整个PyTorch的基石,事实上,无论是神经网络还是其他机器学习算法,无论是CV(计算机视觉),还是NLP(自然语言处理),都依赖于对数据的有效表示和操作,而Tensor就是为此而生,Tensor正是PyTorch中最终用于承载数据的数据结构。详细来说,Tensor在Pytorch
2023年9月20日
其他

机器学习算法与Python实战P7:概率论基础(下)

机器学习算法与Python实战P1:搭建开发环境机器学习算法与Python实战P2:Python基础机器学习算法与Python实战P3:Numpy基础机器学习算法与Python实战P4:Pandas机器学习算法与Python实战P5:Matplotlib&Seaborn机器学习算法与Python实战P6:Scikit-Learn机器学习算法与Python实战P7:概率论基础(上)正文共:
2023年9月18日
其他

机器学习算法与Python实战P7:概率论基础(上)

机器学习算法与Python实战P1:搭建开发环境机器学习算法与Python实战P2:Python基础机器学习算法与Python实战P3:Numpy基础机器学习算法与Python实战P4:Pandas机器学习算法与Python实战P5:Matplotlib&Seaborn机器学习算法与Python实战P6:Scikit-Learn正文共:
2023年9月17日
其他

PyTorch那些事儿(二):PyTorch建模示例

PyTorch从入门到项目实践PyTorch那些事儿(一):深度学习环境搭建一个完整的模型训练过程包括数据准备、模型搭建、训练与优化等过程,每个过程又涉及若干不同的知识点,本篇中,我们通过一个示例,从整体层面介绍PyTorch的完整建模流程,通过这个例子,我们可以知道建模流程中的各个环节所要做的事情及其意义。在后续的博客中,我们将展开介绍各个过程环节涉及的相关知识内容。1
2023年9月16日
其他

PyTorch那些事儿(一):深度学习环境搭建

installation”,选“Yes”,一般两三分钟就能安装完成。安装完成后,再次运行“nvidia-smi”,能成功运行并显示显卡信息,则表示显卡驱动安装成功,如下图所示:$
2023年9月15日
其他

PyTorch从入门到项目实践

大家好,我是老章。2019年Google将TensorFlow升级到了2.0,我的好友奥辰同学撰写了一些列TensorFlow2.0的技术文章并发布到了我的公众号:TensorFlow2.0入门教程但是后来他转投PyTorch阵营,在看过太多不成体系的技术文章后,发现很多教程过于偏重理论、代码分析不够通俗易懂,很少有从建模层面去介绍细节。所以,他结合了众多开源项目+真实建模经历+PyTorch官方文档+技术博客后,开发了这套PyTorch教程。我看过之后非常喜欢,理由只有一个:这完全是从一个初学者角度,结合自身学习和项目实战经验开发的聚焦建模过程的PyTorch课程,对初学者十分友好。无论你是初学者,还是已有一些基础知识,这个课程都将帮助大家深入理解和掌握Pytorch,在深度学习的道路上更进一步!1、Why
2023年9月14日
其他

机器学习算法与Python实战P6:Scikit-Learn

机器学习算法与Python实战P1:搭建开发环境机器学习算法与Python实战P2:Python基础机器学习算法与Python实战P3:Numpy基础机器学习算法与Python实战P4:Pandas机器学习算法与Python实战P5:Matplotlib&Seaborn正文共:11071字
2023年9月11日
其他

机器学习算法与Python实战P5:Matplotlib&Seaborn

本文1.7万字,预计阅读时间45分钟机器学习算法与Python实战P1:搭建开发环境机器学习算法与Python实战P2:Python基础机器学习算法与Python实战P3:Numpy基础机器学习算法与Python实战P4:Pandas市面上的Matplotlib教程大部分都只注重各种图表的绘制方法,本文略有不同,比如在5.2节会重点突出Matplotlib图表布局、组件构成等底层原理,掌握这些之后,绘制各种各样图表就有思路了。Matplotlib的学习,从数据分析师的角度或机器学习工程师的角度学习重点会略有不同,比如后者偏重:数据分布的可视化:使用直方图、盒形图和小提琴图来了解数据的分布和离群值。特征关系的可视化:使用散点图和相关热图来了解特征之间的关系。模型性能的可视化:使用混淆矩阵、ROC
2023年9月9日
其他

机器学习算法与Python实战P4:Pandas

机器学习算法与Python实战P1:搭建开发环境机器学习算法与Python实战P2:Python基础机器学习算法与Python实战P3:Numpy基础Pandas
2023年9月6日
其他

机器学习算法与Python实战P3:Numpy基础

机器学习算法与Python实战P1:搭建开发环境机器学习算法与Python实战P2:Python基础关于
2023年8月29日
其他

机器学习算法与Python实战P2:Python基础

等数据科学和机器学习库。侧重点:数据清洗、数据可视化、数据分析、特征工程、模型训练和调优、模型评估等等。项目实践:预测模型、分类模型、聚类、深度学习、自然语言处理等。Python
2023年8月26日
其他

机器学习算法与Python实战P1:搭建完美的机器学习开发环境

这是计划的一部分工欲善其事必先利其器,玩转机器学习,环境问题将一直伴随我们。一个完美的机器学习开发环境,可以让我们少一些糟心事,同时省下不少时间。本文我向大家详细介绍自己用着非常舒服的环境,结构如下:目录Python
2023年8月21日
其他

XGBoost中10个最常用超参数调优指南

本文将详细解释XGBoost中十个最常用超参数的介绍,功能和值范围,及如何使用Optuna进行超参数调优。对于XGBoost来说,默认的超参数是可以正常运行的,但是如果你想获得最佳的效果,那么就需要自行调整一些超参数来匹配你的数据,以下参数对于XGBoost非常重要:etanum_boost_roundmax_depthsubsamplecolsample_bytreegammamin_child_weightlambdaalphaXGBoost的API有2种调用方法,一种是我们常见的原生API,一种是兼容Scikit-learn
2023年8月10日
其他

Jupyter大升级!AI 加持,聊天写代码

等各大明星公司和机构。项目地址:https://github.com/jupyterlab/jupyter-ai有了大模型的加持,Jupyter
2023年8月4日
其他

PDF下载,深度学习口袋书

变笨了,但还有自知之明机器学习中的最优化算法(全面总结)机器学习知识卡片:降维方法(PCA、ICA、LDA、t-SNE)统计学经典书籍更新
2023年8月2日
其他

72张PNG,图解机器学习

大家好,我是章北海之前看过一个手绘风格《图解机器学习》项目,然后翻译了其中一部分机器学习知识卡片:聚类机器学习知识卡片:集成方法机器学习知识卡片:优化方法机器学习知识卡片:降维方法挺费劲的,这个系列分为基础和工程两个部分,共72张图喜欢的同学可以看英文原版:https://illustrated-machine-learning.github.io/中文版下载(文末)目录如下:机器学习基础:1.
2023年7月31日
其他

花了一个小时,刷完了吴恩达的新课

LLM)强烈建议大家去学习一下:https://learn.deeplearning.ai/huggingface-gradio/GPT-4
2023年7月29日
其他

神经网络背后的数学原理是什么?

神经网络是线性模块和非线性模块的巧妙排列。当聪明地选择并连接这些模块时,我们就得到了一个强大的工具来逼近任何一个数学函数,如一个能够借助非线性决策边界进行分类的神经网络。本文代码的如下:git
2023年7月28日
其他

GPT-4 变笨了,但还有自知之明

level.翻译A:在决定如何和在哪里存储数据之前,选择合适的存储级别是至关重要的。翻译B:在决定如何以及在哪里存储数据之前,选择适当的存储级别至关重要。原文2:The
2023年7月23日
其他

机器学习中的最优化算法(全面总结)

导言对于几乎所有机器学习算法,无论是有监督学习、无监督学习,还是强化学习,最后一般都归结为求解最优化问题。因此,最优化方法在机器学习算法的推导与实现中占据中心地位。在这篇文章中,小编将对机器学习中所使用的优化算法做一个全面的总结,并理清它们直接的脉络关系,帮你从全局的高度来理解这一部分知识。
2023年7月21日
其他

统计学经典书籍更新 Pyhton 版,官方首发电子书 PDF下载

Learning)」第一版发布于2013年,可以说是数据科学领域的必读书!💬
2023年7月19日
其他

机器学习知识卡片:优化方法

客户端下载数据分析入门:统计学基础知识总结可能是全网最全的速查表:Python
2023年6月30日
其他

数据分析入门:统计学基础知识总结

JR们好,这是我校友兄弟写的一篇文章。他经济学硕士成功转行数据分析,前期和面试准备的很充分。所以我邀请他写个专栏,框架搭好后刚写了几篇就入职了,工作太忙就没空再写了。本文是技能需求篇《统计学基础知识》,付费阅读,收费5元苹果用户可以加我微信,直接转账,就不用给库克手续费了下图就是他找工作时期的知识储备,也是原计划要的课程框架,不写完还真可惜了。课程框架统计学基础导读这部分开始,我们就开始正式介入数据分析师的一些基础知识的学习。在这里,我们本章节先从统计学基础开始。
2023年4月28日