avatar
文章
42
标签
21
分类
12
首页
归档
标签
分类
关于
吏部侍郎
搜索
首页
归档
标签
分类
关于

吏部侍郎

工作的处理方式
发表于2019-03-16|Job
工作经验 做项目,不管是哪个岗位,包括我,现在是运营岗位,与客户对接是最多的。 客户在使用我们的产品的时候,疯狂吐槽我们某一个功能,这就是风险,比如吐槽你的语义,吐槽你的NLP,这就是风险。我们需要领导意识到这个风险。 因为接下来,如果客户与我们合作有二期项目,接下来可能二期的合同还会用到我们的语义。 而这个时候,一期用户对我们的语义印象极差,二期客户可能就不和我们签语义的合同,公司就会有损失。 这就是很大的风险。 我们应该反馈给项目经理,项目经理没有意识到我们就应该越级反馈,被领导骂了又怎样。直到达到应有的效果。 碰到事儿不能怕事儿,要去解决它! 工作习惯 数据是在你身边的,我们要注意到,要注意数据的价值。会议上客户说的数据,我们要注意收集,整理! 这在市场分析的时候,市场的盘子有多大,很有可能会用到。
pandas中轴axis的问题理解
发表于2019-03-14|数据分析
在学习删除方法drop时,碰到了,也突然想明白了,轴是什么意思。 引入: import numpy as npfrom pandas import Series,DataFrame#导入包obj = Series(np.arange(5),index = ['a','b','c','d','e'])#创建Series objobjOut[2]: a 0b 1c 2d 3e 4dtype: int32new_obj = obj.drop('c')#删除'c'new_objOut[5]: a 0b 1d 3e 4dtype: int32objOut[6]: a 0b 1c 2d 3e 4dtype: int32obj.drop(['b','d'])#删除'b','d'Out[7]...
统计学复习
发表于2019-03-14|数据分析
简介 统计学是一门独立的学科。 统计学研究的是随机现象,而数学研究的是确定性的规律。 统计学的应用性很强,许多概念和原理来自于实际需要。 数学在统计学中很重要。 什么是统计学?简单来说,统计学是一门教会我们如何同数据打交道,从中获取有用信息,并得出结论的学科。 统计学定义;统计学是用来收集和分析数据的一门学科和艺术。《大不列颠百科全书》统计学,具体来说,就是一门关于数据收集、整理、描述和分析的学科。 试验设计是统计学的分支。 几个统计学概念1.总体、总体容量(总体量)2.个体4.样本、样本容量(样本量)5.变量(研究对象的特征或属性)、变量值6.随机变量 主要内容数据的收集与描述收集1.文献资料2.观测3.试验(自然科学研究,工业,好的试验设计的重要性)4.问卷调查(社会科学,心理学,市场调研)5.互联网(爬虫,电商)6.物联网技术(会员卡,条形码) 数据的描述性分析这里主要介绍一些基本概念,包括算数平均数,加权平均数,几何平均数,调和平均数,极差,四分位差,平均差,方差,标准差,离散系数,峰度等。还复习了下数据的标准化,及是非标志的平均数和标准差。 统计抽样推断统...
拉钩数据职位分析报告
发表于2019-03-14|数据分析
本篇博客写于研究生期间。 试着,做了一个拉勾网数据分析师职位的数据分析。 其实,虽然很想做数据分析师,但是是跨行,心里相当忐忑,做这个分析就相当于加深自己对数据分析这个行业的了解了。 思路 起始数据来源本来是想自己写个爬虫的,可是学了好久,还是不能融会贯通,总会出一些bug,只能继续学习,争取早日修成爬神功。又想着,总不能还没开始,就结束了这次实验。最后无意中发现了一个爬虫工具–八爪鱼、、只需要点点点(其实,当时有种挫败感)。不过,总算数据总算有了。 数据的采集数据的具体采集过程如下: 下载安装八爪鱼采集器。 创建任务,选择列表及详情。 输入任务名称、备注。 输入采集网址 设置详情页链接,也就是点进具体的详情页。 设置好翻页。 点击需要采集的数据信息。 开始采集。 数据导出为excel。 过程数据的清洗与处理这里试着用了两种工具,Excel + Python,也比较了一下二者的优点。与前人所述基本一致,纸上得来终觉浅啊。 想说一下字段的命名,如果用了Python进行处理的话,最好还是把字段命名为英文,或者说字母。可以简化后期处理,会方便很多。 当然,你如果全用Excel是...
Python常见错误
发表于2019-03-14
python常见错误pandas读取文件报错 文件不存在import pandas as pdpath = r'C:\Users\admin\Desktop\data\19\190103am9'data = pd.DataFrame(pd.read_excel(path)) 运行报错如下: FileNotFoundError: [Errno 2] No such file or directory:’C:\Users\admin\Desktop\data\19\中国人寿190103am9’ 文件不存在那肯定是路径的问题。去看路径,哎,好像没问题啊,都是对的。 但是仔细看几遍,你就会发现,文件路径的最终文件名没有加后缀。 改成: path = r'C:\Users\admin\Desktop\data\19\190103am9.xlsx' 成功。
Pandas数据类型转换的大坑
发表于2019-03-14|数据分析
Pandas的数据类型是一个必须要注意的地方!!! 数据类型,开始我真的没怎么太注意。。后来真的是掉进了这个大坑。将我埋掉了。 问题起源首先,我要对数据进行去重,再去重之后,在对数据的call_id进行计数,最终我发现,我和别人统计的结果有差别。差了1。 我是拿到数据,直接导入pandas,然后直接去重。最后掉进了这个大坑。 import pandas as pdimport globpath = r'C:\Users\admin\Desktop\renshou\data'#路径filenames = glob.glob(path + "/*.txt")#文件路径call_data = pd.DataFrame()list_call_data = []#用pandas读取所有数据,并连接到一个DataFrame中。for file_name in filenames: filename =open(file_name) df = pd.read_table(filename,sep = ',',he...
sqlzoo练习答案练习题答案记录
发表于2019-03-14|数据分析
这是关于在一个SQL学习网站的练习题答案记录:SQL教程 SQL基础由一些简单的查询开始这里的默认表格为WORLD表格 。 name continent area population gdp Afghanistan Asia 652230 25500100 20343000000 Albania Europe 28748 2831741 12960000000 Algeria Africa 2381741 37100000 188681000000 Andorra Europe 468 78115 3712000000 Angola Africa 1246700 20609294 100990000000 …. name:国家名称 continent:大洲 area:面积 population:人口 gdp:国内生产总值 SQL对大小写不敏感。 以显示德国德国的人口。 SELECT population FROM worldWHERE name = 'Germany' 查询面...
读书笔记
发表于2019-03-06|读书笔记
有时,真是不能理解自己,所有的正统书籍都看不进去(当然不包括专业书籍,以及教学书),却对各种网文情有独钟,这么多年,玄幻文,历史文,穿越文,科技幻想,武侠等等,读了不知道多少。 总结下,最喜欢的作者是烽火戏诸侯,最喜欢的书是《雪中悍刀行》,有时间,定要再读。 [TOC] 机破星河 有一个人说过,在这个世界上,看到的永远是表象。越接触这个庞大的世界,才越知道自己的渺小。如果一路冒然的撞过去,很有可能会头破血流。” 不敬强权,不畏死亡,心怀梦想,至死方休。 我的1979 大多数人想要改造这个世界,但却罕有人想改造自我”。 侠行天下 我和你讲道理,你和我耍流氓,我和你耍流氓,你和我讲法律,我和你讲法律,你和我玩实力,我和你玩实力,你和我讲道理……就是这个意思,这个世界的公道终究是力量来决定,所谓的法律,永远是统治阶层为了更好统治而立下的秩序 大魏宫廷 注:一个冷知识,为何握手是用右手?因为古代普遍是右手拿兵器,摊开右手,表示手中没有兵器,这是向对方表达善意的举动,不是因为惯用手的缘故。同理,抱拳时左手压右手,左手为尊,压着右手,象征和平。(经查证确实有这种说法) 大国医 步...
SQL的学习
发表于2019-03-06|数据分析
SQL的学习之路,主要参考资料是: SQL必知必会W3school的SQL简介 右击,新标签页即可打开原图 操作使用的数据库为Access及MySQL。 数据采用的是SQL必知必会中的数据 (最下方可以下载数据)。其有5个表,表的关系如下: 看不清的图片:右击新标签页打开即可。 SQL基础 检索数据 排序检索数据 过滤数据 高级过滤 通配符过滤 创建计算字段 函数特性 函数 汇总数据 分组数据 以上测试均在Access数据库中进行,以下于MySQL中进行,通过workbench(版本6.3)操作。 子查询这里说白了就是select语句嵌套,如select * from (select cust_name from customers) 联结笛卡尔积 高级联结 如果3个以上的表,那怎样联结? 3个 use test;select cust_name,cust_contactfrom (customers inner join orderson customers.cust_id = orders.cust_id)inner join orderitems on...
精益数据分析-笔记
发表于2019-03-06|读书笔记
市场细分市场细分(market segmentation)是指营销者通过市场调研,依据消费者的需要和欲望、购买行为和购买习惯等方面的差异,把某一产品的市场整体划分为若干消费者群的市场分类过程。每一个消费者群就是一个细分市场,每一个细分市场都是具有类似需求倾向的消费者构成的群体。 同期群分析同期群分析(Cohort Analysis,亦称群组分析)的主要目的是分析相似群体随时间的变化(比如用户的回访)。 A/B测试A/B 测试,简单来说,就是为同一个目标制定两个方案(比如两个页面),让一部分用户使用 A 方案,另一部分用户使用 B 方案,记录下用户的使用情况,看哪个方案更符合设计。 多变量测试我认为,多变量测试,其实就是类似于做实验的时候的多因素实验。你不知道哪个因素对结果(指标)的影响是最大的,类似于通过方差分析等手段来判断。只不过,多变量测试的结果,可能更加直观。 好久没发过,东西了。这段时间,毕业、入职,也断了学习。 进入公司,虽然没了自由,但是所幸,总算可以静下心来,沉淀一下。 无论什么时候,坚持学习,才能不断进步。 星空大海的未来三十多年,从今年...
1…345
avatar
华子
一个懂业务的AI产品经理
文章
42
标签
21
分类
12
最新文章
醒醒!AI编程工具压根不是给程序员的,而是给每一个想“偷懒”的你
醒醒!AI编程工具压根不是给程序员的,而是给每一个想“偷懒”的你2025-10-17
GLM-4.6 + Claude Code实战:从入门配置,到一个差点翻车的项目
GLM-4.6 + Claude Code实战:从入门配置,到一个差点翻车的项目2025-10-09
你的 RAG 还在“垃圾进,垃圾出”?我用这套流程,把“废料”文档变成了黄金知识库
你的 RAG 还在“垃圾进,垃圾出”?我用这套流程,把“废料”文档变成了黄金知识库2025-09-09
我如何将一个Dify周报助手,从Demo迭代到生产可用(附踩坑经验)
我如何将一个Dify周报助手,从Demo迭代到生产可用(附踩坑经验)2025-08-30
我用AI开发Dify工具,意外发现一个“邪修”法门:让它自己对答案
我用AI开发Dify工具,意外发现一个“邪修”法门:让它自己对答案2025-08-23
分类
  • AI编程5
  • Agent3
  • Dify1
  • Job3
  • LLM2
  • MCP1
  • 业务应用3
  • 学习2
标签
Pandas 博客 硕士期间 AI绘画 大模型 Dify MCP AI编程 AI,ASR,TTs,NLP Agent SQL hexo 工具 读书笔记 Data analysis 理财 python 经验 生活 学习 数据分析
归档
  • 十月 2025 2
  • 九月 2025 1
  • 八月 2025 4
  • 七月 2025 2
  • 六月 2025 1
  • 五月 2025 3
  • 四月 2025 4
  • 三月 2022 1
网站信息
文章数目 :
42
运行时间 :
本站总字数 :
85.2k
本站访客数 :
本站总浏览量 :
最后更新时间 :
© 2025 By 华子框架 Hexo 7.3.0|主题 Butterfly 5.5.0
搜索
数据加载中