贝叶斯MCMC模拟是一个丰富的领域,涵盖了各种算法,共同目标是近似后验模型。例如,使用的rstan包采用了一个HamiltonianMonteCarlo算法。用于贝叶斯建模的另一个rjags包采用了Gibbssampling算法。尽管细节有所不同,但这两种算法都是基于基本的Metropolis-Hastings算法的变体。 主要思想 考虑以下数值结果为Y的正态-正态模型,其围绕未知均值μ的标准差为0.75: 相应的似然函数L(μ|y)和先验概率密度函数f(μ)对于y∈(−∞,∞)和μ∈(−∞,∞)是: 假设我们观察到一个结果Y=6.25。μ的后验模型是具有均值4和标准差0.6的正态分布:...

分析师:YueYu 如何精准定位目标客户,准确量化客户需求来开发新的产品组合,并预测其可能的市场份额。 解决方案 任务/目标 根据零售业务营销要求,运用多种数据源分析向客户给出产品性能组合的建议。 数据源准备 搜集除已有销量数据之外的额外信息包括对潜在消费者进行市场调查,收集其基本信息(地点、年龄、可支配收入等)及其对产品的购买欲望,对产品各维度性能的重视程度以及对产品功能的重要性排序,再在搜集的数据基础上进行预处理。收集现有的产品功能以及市面上相同种类竞品拥有的产品功能。 有了数据,但是有一部分特征是算法不能直接处理的,还有一部分数据是算法不能直接利用的。 特征转换 潜在消费者地区。需要把...

餐饮业作为实体经济的重要组成部分,对于促进经济增长、刺激消费、增加就业和改善民生具有十分重要的作用。随着全球科技革命和产业变革的加速推进,数字化转型已成为产业发展的必然趋势,其中大数据、物联网、人工智能、云计算、虚拟现实和5G等信息技术正在与实体经济深度融合,为餐饮业带来了更多的新业态和新模式。 作为数字经济与实体经济融合发展的重要领域,数字技术在餐饮业中的应用已经无处不在。数字供应链、扫码点餐、移动支付、在线外卖、在线点评和中央厨房等数字化场景已经成为餐饮业发展的必备工具。餐饮业数字化是产业数字化在餐饮业的体现,它涉及将数字技术应用于餐饮生产的各个环节,以数据要素为主要驱动力,以提升效率和...

本白皮书报告合集是全市场聚焦中国碳金融领域的洞察白皮书。白皮书报告合集中巧妙结合了中国特色与国际经验、理论研究与前沿实践、监管导向与市场声音,全面探讨了在中国碳市场蓬勃发展的时代脉络中,金融力量的角色与作用。 本白皮书报告合集着眼于创新,在充分理解中国碳市场的特殊性与独特特征基础上,立足碳市场发展取得的卓越成就,提出了中国碳金融生态的全景视图,探索出了中国碳金融创新的六大核心模式,在各个模式中结合现状和市场实践,探讨了符合中国实际的创新展望。 中国的碳金融发展之路必须有中国的特色。我们将吸收国际先进经验,但同时,我们更需要展现创新精神,开辟一条符合我国实际和“双碳”目标的特色之路。让我们携手共...

2022年,全国药品流通市场的销售规模稳中有升。统计显示,全国七大类医药商品销售总额为27516亿元,同比增长6.0%,但增速同比放缓了2.5个百分点。其中,药品零售市场的销售额为5990亿元,同比增长10.7%,增速同比加快了3.3个百分点;而药品批发市场的销售额为21526亿元,同比增长5.4%。 截至2022年底,全国共有64.39万家持有《药品经营许可证》的企业。其中,批发企业有1.39万家,零售连锁企业有6650家,下辖门店36万家,零售单体药店有26.33万家。 全国药品销售稳中有升。生产企业占比小升,批发企业占比适中增,终端销售占比大降,直接出口稳定。 按照销售渠道划分,202...

分析师:YeYuan 随着互联网、5G时代到来,大数据横空出世,数据变得越来越重要,如何针对业务问题和需求,提取有效特征数据并对问题进行深入分析,最终得到可靠的结论是数据分析最核心的环节,只有得出正确的结论才能对症下药,提出正确的方案,为产品运营提供有力支撑; 然而恰恰是在深入分析并得出可靠结论这阶段最难实现,分析角度不能完全依赖主观猜想,而需要客观系统的逻辑思维,这将是最大的挑战; 以淘宝用户行为分析为例: 任务/目标 通过探索用户行为规律,为平台运营提供数据支撑,从而帮助淘宝商家实现营收增长。 数据准备 数据源于淘宝某商品买家行为数据集,该数据集包含用户的所有行为(包括点击、购买、加购、...

  MFqKcJmbshKy   2023年12月12日   23   0   0 数据数据集数据集mysql数据mysql

本文以R语言为工具,帮助客户对汽车网站的口碑数据进行抓取,并基于文本数据分词技术进行数据清理和统计。通过词频统计和词云可视化,对口碑中的关键词进行分析,挖掘出消费者对汽车的评价和需求,为汽车制造商和销售商提供重要的市场参考。 随着社会经济的不断发展,汽车已经成为人们日常生活中不可或缺的交通工具。汽车口碑对于消费者购车决策起着至关重要的作用,同时也是汽车制造商和销售商了解市场需求、改进产品质量和服务的重要依据。传统的汽车口碑调查方式往往需要耗费大量的人力物力,而网络上的汽车口碑数据正逐渐成为研究汽车市场和消费者需求的重要数据来源。然而,如何高效地获取和分析这些数据变得越来越重要。因此,本文利...

  MFqKcJmbshKy   2023年12月12日   81   0   0 建模建模词频数据数据词频

未来,生成式人工智能将推动AI医学影像企业的指数级增长,而综合性医学人工智能模型与医学影像领域的结合将释放巨大潜力。为加速自身商业化落地能力,AI医学影像企业将依托生态路线 由于老龄化加剧、医疗资源分配不均和医学影像领域人才短缺等原因,医学影像医生承受着巨大的工作压力。老年人群中慢性病患病率迅速增长,据流行病学数据调查显示,2018年老年人慢病患病率为62.3%,比2008年的46.8%上升了15.5%。同时,由于医疗资源分布不均,大量患者涌入三级医院,给影像科医生带来巨大的工作负担。 据统计,我国医学影像数据每年增长30%,而影像科医生年增速仅为4%。以CT报告为例,影像科医生每天需要完成8...

分析师:XuZhang 数据变得越来越重要,其核心应用“预测”也成为各个行业以及产业变革的重要力量。对于股市来说,用人工智能来对股价进行预测成为量化投资的一个重要手段。本项目帮助客户运用powerBI获取网易财经上茅台2020年股票数据、并用SPSSmodeler的类神经网络模型对第二天股价涨跌幅度进行预测。 数据收集和处理: 数据对于机器学习十分重要。没有合适的数据,就无法训练机器学习模型,运用powerBI上的数据爬取功能,获取网易财经上贵州茅台2020年全年数据、并进行数据清洗。 1、根据网页结构,构建参数和自定义函数 2、用URL高级功能获取茅台2020年数据 3 、...

最近我们被客户要求撰写关于异常值检测的研究报告,包括一些图形和统计输出。 识别异常值的方法有很多种,R中有很多不同的方法。  关于异常值方法的文章结合了理论和实践。理论一切都很好,但异常值是异常值,因为它们不遵循理论。如果一种方法发现我们都认同的异常值,那么这种方法可以认为是不错的。 异常值概述(O3)图旨在帮助比较和理解异常值方法的结果。 Stackloss数据集的O3图。每个变量组合(由左边的列定义)一行,找到了异常值,并将每个案例的一列标识为异常值(右边的列)。 威尔金森的算法为整个数据集找到了6个离群值(图的最下面一行)。总体而言,对于各种变量组合,发现14个案例是潜在的异...

分析师:ShilinChen 离职率是企业保留人才能力的体现。分析预测职员是否有离职趋向有利于企业的人才管理,提升组织职员的心理健康,从而更有利于企业未来的发展。 解决方案 任务/目标 采用分类这一方法构建6种模型对职员离职预测,分别是逻辑回归、梯度提升、随机森林、XGB、CatBoost、LGBM。确定某一职员属于是或否离职的目标类,并以此来探究职员大量离职的潜在因素。 数据源准备 员工离职数据,属性包括职员的年龄,出差频率、部门、受教育水平、工作参与度和工作等级等等。 特征转换 是否离职、性别等字符串型数据分别用0或1代替,出差频率等按等级用0-2的数字代替。 构造 以上说明了如何抽取相关...

是什么让一个电影受欢迎?也许是影片的总收入(影院条目和DVDsellings)。我们选择的变量将是票房(gross)或观众评分(movie_facebook_likes)。众所周知,关于IMDB和番茄的好评与高收益的电影有关。我们的分析旨在回答以下研究问题:“我们能在仅知道它的类型,流派(流派变量),MPAA评级(MPAA_RATING变量),发布一个月(thtr_rel_month变量),发布日(thtr_rel_day变量),IMDB的票数(imdb_num_votes变量),评论家得分(critics_score变量)和最佳影片提名(best_pic_nom变量)等变量能否预测一部电影收...

信用风险建模是金融领域的重要课题,通过建立合理的信用风险模型,可以帮助金融机构更好地评估借款人的信用状况,从而有效降低信贷风险。本文使用了R语言中的逻辑回归(logistic)模型,利用国泰安数据库中的103个上市公司的数据进行信用风险建模,其中包括51个正常公司和52个ST公司。在这个数据集中,我们选取了经营活动产生的现金流量净额、净资产收益率、每股收益和每股净资产等指标来分析其对公司是否为ST股票的影响。 研究目的  通过对某股票数据分析,了解经营活动产生的现金流量净额、净资产收益率...每股收益和每股净资产对股票是否ST的影响。 数据介绍 某年度随机抽取的102个股票。因变量...

  MFqKcJmbshKy   2023年12月12日   17   0   0 拟合建模数据拟合数据建模

在企业的数字化转型过程中,员工对数字化工具的充分运用能够持续推动企业生产力的提升。这些数字化工具并不仅仅是局限于某一方面的软件或者工具,而是涉及整个业务链的数字化生态系统,不同的业务场景需要不同的工具、系统或平台来支持。 根据调研数据,我们发现有97.1%的受访者在工作中不同程度地使用了多种数字化工具。 从不同行业来看,办公协同工具在几乎所有行业中都得到了广泛应用,其中能源矿产行业的使用率最高,达到60%。然而,不同行业也有其特殊性。例如,金融业对数据运营和营销服务工具的应用比例最高;而生产/加工/制造业则更注重生产管理工具的使用。 IT和金融行业更加认同数字化工具的效率提升功能,而教育和物...

自九十年代以来,中国跨境电商已经经历了四个发展阶段,其中B2C跨境电商有望在2022年后迎来高峰。 通过分析B2C跨境电商市场的发展驱动因子,预测到2030年,全球跨境电商市场商品价值将突破2万亿美金。 在近年来崛起的中国卖家主要使用的跨境电商平台中,有四家本土平台被称为中国电商“出海四小龙”,它们在规模和玩法上屡有创新。 AliExpress、SHEIN、Temu及TikTokShop各有侧重,包括覆盖的国家、规模和品类。 速卖通(AliExpress)是阿里巴巴旗下的跨境电商平台,拥有完善的物流和交易体系,覆盖全球主要市场,拥有庞大的用户规模。 SHEIN(希音)是一家主打快时尚的跨境电...

最近我们被要求撰写关于偏最小二乘回归PLS-DA的研究报告,包括一些图形和统计输出。 主成分回归(PCR)的方法本质上是使用第一个方法的普通最小二乘(OLS)拟合 来自预测变量的主成分(PC)。这带来许多优点: 预测变量的数量实际上没有限制。   相关的预测变量不会破坏回归拟合。 但是,在许多情况下,执行类似于PCA的分解要明智得多。 今天,我们将在Arcene数据集上执行PLS-DA,  其中包含100个观察值和10,000个解释变量。 让我们开始使用R 癌症/无癌标签(编码为-1/1)存储在不同的文件中,因此我们可以将其直接附加到完整的数据集...

研究的背景及意义 众自20世纪80年代至今,随着改革开放的深入以及中国最终加入WTO,我国的对外贸易实现了跨越式的发展,中国已经成为世界第一大出口国和第二大进口国,中国经济对世界经济做出了重大贡献。与此同时,中国经济自身的外贸依存度也已经达到了很高的水平,因此正确分析预测我国的进出口贸易额将对我国对外贸易的发展起着举足轻重的作用。  本文帮助客户在分析了我国出口总额的基础上,根据其数据特征建立ARIMA模型和指数曲线趋势外推模型,主要利用Eviews对模型进行检验分析,从而预测了中国出口贸易总额。 数据的选取与描述性统计 本文选取了1978-2012进出口总额数据(X),(见图1)...

本文使用R语言帮助客户进行了贝叶斯模型预测电影评分,并对数据进行了可视化和分析。文章创建了五个新的特征变量,包括电影类型、导演获奖情况、电影票房、评论数量和影评人数量等,并分析了这些变量对电影评分的影响。通过模型预测和系数解释,发现imdb_rating具有最高的后验概率,且截距和运行时对观众评分有积极影响,而评论数量和影评人数量对观众评分的影响较小。文章还提供了对数据的探索性分析,并得出了某些见解,如舞蹈电影更受欢迎,较长的电影通常会让观众感到无聊等。 读取数据     load("e1fevies.Rdata") 数据 数据概述 数据集电影包括2016年之前发布的...

报告合集对中国新能源汽车市场的发展机遇、当前行业状况及未来趋势进行了详细分析。同时,从专业角度分享了海外市场的前沿经验以及中国新能源汽车生态的案例。报告合集总结指出,新能源汽车专属车险的发展和完善不仅是新能源汽车产业高质量发展的内在要求,也是贯彻新发展理念、推动高质量发展、构建新发展格局、实施供给侧结构性改革的必然要求。 新能源汽车因其节能、环保、静音、维护成本低等优势,其专属车险的开发和发展完善将极大地助力我国生态文明建设,助力实现“双碳”目标。坚持可持续发展,走人与自然和谐共生的中国式现代化道路,为我国的生态环境保护和中华文明永续发展贡献力量。 由于新能源汽车的高出险率和案均赔款额高,财...

近年来,汽车市场中的品牌销量排名发生了巨大的变化,形成了比亚迪和大众两大巨头。比亚迪在中国品牌中的销量增长迅速,特别是在新能源领域,引领着中国品牌的快速增长。豪华品牌方面,形成了一个由BBA和特斯拉组成的新一线阵营。而合资品牌中,只有大众、丰田和本田的排名相对稳定,其他品牌的销量均呈现下滑趋势。 随着市场竞争格局的巨大变化,品牌集中度也在持续增长。近三年来,CR3从26%提升至28%,呈现出明显的马太效应。 目前,汽车市场竞争已从大众、BBA为核心的两簇竞争圈演变为大众、BBA、比亚迪+新创品牌的三簇竞争圈。 此外,乘用车市场的单车售价呈现出明显的上涨趋势。其中,豪华品牌和中国品牌的售价持续...

关注 更多

空空如也 ~ ~

粉丝 更多

空空如也 ~ ~