查看原文
其他

借助chatGPT更高效地学习Python文本分析

大邓 大邓和他的Python
2024-09-09

对编程0基础的人而言,三个痛点及解决办法

学习痛点解决办法
软件安装配置环境淘宝搜「python环境配置」,30min,30元左右搞定
敲代码遇到问题,缺乏及时的答疑解惑会正确上网,向chatGPT(实时应答的编程教练)提问
如何使用编程语言解决社科类科研数据挖掘问题学一门含有Python语法、代码技术、科研应用三类内容的课程,如Python实证指标构建文本分析,掌握并内化 最少必要知识量。明白原理,会把需求转化成问题,向chatGPT提问。

三种痛点及解决办法,可以将Python文本分析开展社科类科研数据挖掘的门槛大大降低。


用术语提问

如果把社科数据分析需求比作城堡, 我们需要掌握拆解成多个小积木的能力,之后每个小积木让chatGPT帮我实现。我们要做的是

  • 心中有施工蓝图,把大城堡拆解成多个小积木
  • 每个小积木,要尽量用术语向chatGPT提问
  • 对chatGPT回答进行检查和实验
  • 最后,按施工蓝图把多个小积木搭成城堡。

这需要我们掌握最少必要知识, Python语法,如数据类型、逻辑语句、常用库、常用函数、科研应用案例。


提问案例

多观察代码,学会基本提问, 例如

  1. 我是Python初学者,正在学Python。希望你当做我的Python解释器,我输入代码,你帮我运行并返回中文解释。
  2. 如何用Python写for循环
  3. 我想用Python统计某个词语列表中某些关键词的词频
  4. 如何用Python读取csv
  5. 我的代码出现UnicodeDecode错误, 这是源代码xxxx,这是报错提示,请解释问题,告诉我解决办法。
  6. ......

借助chatGPT写代码应用案例


如何注册chatGPT

科学上网、使用chatGPT都不难的,相关操作,可以参考大邓这篇博文

https://textdata.cn/blog/2023-02-15-how-to-sign-up-the-chatgpt-accout-and-upgrade-to-plus/




精选文章

管理世界 | 使用文本分析词构建并测量短视主义

管理世界 | 使用 经营讨论与分析 测量 企业数字化指标

管理世界 | 用正则表达式、文本向量化、线性回归算法从md&a数据中计算 「企业融资约束指标

可视化 | 词嵌入模型用于计算社科领域刻板印象等信息(含代码)

可视化 | 绘制《三体》人物关系网络图

可视化 | 使用决策树分析小红书帖子数据(含代码)

转载 | 基于词嵌入技术的心理学研究: 方法及应用

赶快收藏 | 社会科学文本挖掘技术资料汇总

B站社会科学文本分析视频合集

词嵌入技术在社会科学领域进行数据挖掘常见39个FAQ汇总

文本分析 | 中国企业高管团队创新注意力(含代码)

文本分析 | MD&A 信息含量指标构建代码实现

金融研究 | 使用Python构建「关键审计事项信息含量」

金融研究 | 文本相似度计算与可视化

转载 | 社会计算驱动的社会科学研究方法

推荐 | 社科(经管)文本分析快速指南

视频分享 | 文本分析在经管研究中的应用

转载 | 金融学文本大数据挖掘方法与研究进展

转载 | 大数据驱动的「社会经济地位」分析研究综述

使用 Word2Vec 和 TF-IDF 计算五类企业文化

如何用「图嵌入」将企业、高管职业经历表征为向量数据

JM2022综述 | 黄金领域: 为营销研究(新洞察)采集网络数据

MS | 使用网络算法识别创新的颠覆性与否

认知的测量 | 向量距离vs语义投影

Asent库 | 英文文本数据情感分析

PNAS | 文本网络分析&文化桥梁Python代码实现

PNAS | 使用语义距离测量一个人的创新力(发散思维)得分

PNAS | 历史文本中的语言积极性反映了动态的环境和心理因素(含Python代码)

tomotopy | 速度最快的LDA主题模型

数据集 | cctv新闻联播文稿数据

数据集 | 睡前消息文稿数据集

EDGAR | 25年数据的预训练词向量模型(含代码)

2G数据集 | 80w知乎用户问答数据

采购合同数据集 | 政府采购何以牵动企业创新

继续滑动看下一个
大邓和他的Python
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存