肿瘤是近年来严重威胁人类的健康的疾病,据统计,目前大部分种类的肿瘤都呈现不同程度的上升趋势,中国因患肿瘤而死亡的人数约占全球肿瘤死亡总人数的1/4左右,人类正面临着肿瘤防治的新挑战。现代医学治疗肿瘤的手段和方式已经日臻完善,主要为手术配合放、化疗联合治疗。 但传统西医治疗在提高缓解率的同时易产生较强的毒副作用与耐药性。作为传统医学主体的中医药与西医相结合辨证施治,在提高疗效、缓解不良反应等方面有其独特的优势。 本研究帮助客户在收集数据建立抗肿瘤中药数据库的基础上,运用数学模型探寻抗肿瘤中药性效关系及现代药理学研究,为抗肿瘤中医及中西医综合治疗的临证用药提供理论依据。 读取数据  ...

临床决策(clinical decision making)是医务人员在临床实践过程中,根据国内外医学科研的最新进展,不断提出新方案,与传统方案进行比较后,取其最优者付诸实施,从而提高疾病诊治水平的过程。 在临床医疗实践中,许多事件的发生是随机的,对个体患者来说治疗措施的疗效、远期预后常常是不确定的和不可准确预测的,究竟何种选择最好很难简单做出决定。 本文帮助客户进行决策分析NIPPV疗效数据,在充分评价不同方案的风险及利益之后推荐一个最佳的方案,最大限度地保障患者权益,减少临床实践及卫生决策失误。 决策树分析步骤 决策树分析法是通过决策树图形展示临床重要事件的可能发展过...

气候变化是一个全球性挑战,需要国际合作来解决。目前,已有189个国家加入了《巴黎协定》,并且各大经济体纷纷承诺实现碳中和目标,如欧盟委员会的长期战略愿景,中国的碳达峰和碳中和目标,以及美国重新加入巴黎协定。 ICT行业是第一个响应巴黎协定的行业之一,正在积极采取行动。 一方面,ICT行业加强了对社会节能减排的贡献。随着通信技术的发展,移动网络从2G、3G、4G发展到5G,为人们的沟通和生活带来了更多便利,不仅提供语音服务,还有高清语音、移动视频、个人应用等多种功能。特别是5G作为新型信息基础设施,已经融入各行各业,助力社会的数字化转型,并提高传统行业的能源使用效率,促进整个社会的低碳化。 ...

最近我们被客户要求撰写关于GAMs的研究报告,包括一些图形和统计输出。 我们在研究工作中使用广义加性模型(GAMs)。mgcv软件包是一套优秀的软件,可以为非常大的数据集指定、拟合和可视化GAMs。 这篇文章介绍一下广义加性模型(GAMs)目前可以实现的功能。 我们需要加载mgcv     library('mgcv') 受欢迎的例子数据集 dat中的数据在GAM相关的研究中得到了很好的研究,包含了一些协变量--标记为x0到x3--这些协变量在不同程度上与因变量有非线性关系。 我们想通过使用样条来逼近协变量和因变量之间的真实关系来尝试拟合这些关系。为了拟合一个加性模型...

最近我们被客户要求撰写关于信贷风控模型的研究报告,包括一些图形和统计输出。 在此数据集中,我们必须预测信贷的违约支付,并找出哪些变量是违约支付的最强预测因子?以及不同人口统计学变量的类别,拖欠还款的概率如何变化? 有25个变量: 1.ID: 每个客户的ID2.LIMIT_BAL: 金额3.SEX: 性别(1=男,2=女)4.教育程度: (1=研究生,2=本科,3=高中,4=其他,5=未知)5.婚姻: 婚姻状况(1=已婚,2=单身,3=其他)6.年龄:7. PAY_0:  2005年9月的还款状态(-1=正常付款,...

  MFqKcJmbshKy   2023年11月19日   48   0   0 搜索html数据集数据集html搜索

在金融市场中,债券的流动性风险一直是一个备受关注的问题。流动性风险是指在市场上,债券价格的波动程度受到市场流动性的影响,这种影响可能导致债券价格的剧烈波动,从而影响投资者的收益。因此,对于债券流动性风险的度量和管理成为了投资者和金融机构的关键任务。近年来,Copula模型作为一种灵活的统计工具,已经被广泛应用于金融领域。 本文将帮助客户运用Copula模型,对债券的流动性风险进行度量,旨在提供一种新的方法来评估债券的流动性风险。主要是写二元Copula,关于对债券的流动性风险来进行度量,先估计两个的边际分布,然后选择出最优的Copula函数进行联接,之后进行蒙特卡洛模拟。 目前对于边际分布,想...

我们使用广义线性模型(GeneralizedLinearModels,简称GLM)来研究客户的非正态数据,并探索非线性关系。GLM是一种灵活的统计模型,适用于各种数据类型和分布,包括二项分布、泊松分布和负二项分布等非正态分布。通过GLM,我们可以对非正态数据进行建模和预测,并且能够处理计数数据,如客户购买数量、网站点击次数等。GLM还允许引入自变量的非线性效应,从而更好地拟合与响应变量之间的复杂关系。这使得GLM成为处理非正态数据和非线性关系的强大工具。 泊松回归和伽马回归探索联系 如果我们查看火车与机动车碰撞数据,我们会发现一个有趣的模式。     library(re...

在这篇文章中,我将尝试介绍从简单的线性回归到使用神经网络构建非线性概率模型的步骤。 这在模型噪声随着模型变量之一变化或为非线性的情况下特别有用,比如在存在异方差性的情况下。 当客户的数据是非线性时,这样会对线性回归解决方案提出一些问题:   python 添加的噪声量是x的函数 n=20000 ...... x_train=x[:n//2] x_test=x[n//2:] y_train=y[:n//2] ...... plt.show() 线性回归方法 我们用均方差作为优化目标,这是线性回归的标准损失函数。   python model_lin_reg=tf....

 最近我们被客户要求撰写关于回归的研究报告,包括一些图形和统计输出。 本文我们对逻辑回归和样条曲线进行介绍。 logistic回归基于以下假设:给定协变量x,Y具有伯努利分布,     目的是估计参数β。 回想一下,针对该概率使用该函数是     (对数)似然函数 对数似然     其中 。数值方法基于(数值)下降梯度来计算似然函数的 最大值。对数似然(负)是以下函数     negLogLik=function(beta){ -sum(-ylog(1+exp(-(X%%beta))...

  MFqKcJmbshKy   2023年11月19日   34   0   0 htmlcigithtmlgitci

概述: 众所周知,心脏疾病是目前全球最主要的死因。开发一个能够预测患者心脏疾病存在的计算系统将显著降低死亡率并大幅降低医疗保健成本。机器学习在全球许多领域中被广泛应用,尤其在医疗行业中越来越受欢迎。机器学习可以在预测关键疾病(例如心脏病)的存在或不存在方面发挥重要作用。 如果能提前准确预测这些信息,可以为医生提供重要见解,从而能够相应并有效地进行患者治疗。以下演示了对流行的心脏疾病数据库进行的探索性数据分析。除此之外,还使用不同方法(如逻辑回归、随机森林和神经网络)进行心脏病预测。 数据集:数据集包含76个属性,但建议我们只使用其中的14个进行分析。在本文中,使用一个合并的数据集构建分类器,...

混合模型是另一种生成模型,它将数据点的分布建模为多个单独分布的组合("混合")。客户常见的混合模型类型是高斯混合模型,其中数据生成分布被建模为多个高斯分布的组合。     importnumpyasnp importmatplotlib.pyplotasplt 下面是通过三个二维高斯分布的一些数据:   python ...... 绘制数据 plt.plot(X[:,0],X[:,1],'.',alpha=0.2) 让我们使用贝叶斯高斯混合模型对这些数据进行建模。 数据点生成于混合成分的概率由分类分布进行建模,根据权重来决定: 然后,数据点观测值的...

  MFqKcJmbshKy   2023年11月19日   24   0   0 数据建模聚类数据建模聚类

品牌一直在思考如何更好地了解消费者的需求,特别是在年轻化和线上消费趋势加强的母婴行业。根据《2023母婴行业数据报告合集》,短视频直播平台成为该行业新的增长点。报告合集显示,母婴商品的消费人数在2022年全年和2023年前两个月均呈快速增长趋势。用户的购买力和品单价也在提升,实现了双增长。 基于这一行业趋势,《2023母婴行业数据报告合集》通过快手磁力引擎等平台的数据,从母婴内容、用户、商品和消费者等多个角度分析了2021年1月至2023年2月母婴行业的市场现状、细分品类、用户消费特征以及营销前景。该报告旨在帮助母婴行业了解行业发展规律和增长趋势,为其提供更多参考。 当前,快手母婴人群在消费...

随着10月的到来,我们已经踏入了年末冲刺阶段,是否准备好应对家庭的盘问了?工作稳定、挣多少钱、买房与否,最后总是绕不开催婚话题。 报告合集年轻人分享了自己面临的催婚压力和对婚姻的态度及看法。 调查中,74.8%的人认为不存在结婚时限,而25.2%的人则有着结婚期限的设定,其中11.9%的人认为30岁是最后期限。 此外,不同行业的年轻人对于结婚的态度也有所不同。 根据年轻人自评的“想结婚程度值”由高到低排序 制造、房地产、建筑业的年轻人最愿意结婚,他们注重物质生活的稳定,认为爱人的陪伴能给他们安心。 相比之下,法律、媒体文娱/广告营销、教育行业的年轻人对婚姻持佛系态度,他们热衷于自由与无拘无束...

地图本身就是可视化的产品,并在发展过程中形成了一系列的理论与方法。这些都自然地会成为地理空间数据可视化技术的基础。地图学也因可视化方法的提出而获得新的动力。GIS也因可视化的支持而为研究者提供了促使逻辑思维与形象思维相结合的认知工具。 之前我们为一位客户进行了短暂的咨询工作,他正在构建一个知识单元地理数据可视化的应用程序。地理数据包含了地理点数据和地理面数据。在文献中,地理面数据表示作者的国家或者区域,地理点数据表示具体的地址,即作者的研究机构所在的地方。 知识单元地理数据可视化 为此我们采集了一些学者的成果和地理位置数据,进行可视化      读取数据 d...

传统时间序列模型允许包含过去观察到的系列信息,但不允许客户包含其他可能相关的信息。例如,假期的影响、竞争对手的活动、法律变化、整体经济或其他外部变量可能解释了某些历史变动,并且可能导致更准确的预测。另一方面,回归模型允许客户从预测变量中包含大量相关信息,但不允许处理ARIMA模型中可以处理的细微时间序列动态。在本文中,我们帮助客户考虑如何扩展ARIMA模型,以便允许其他信息被纳入模型中。 我们考虑了以下形式的回归模型: 在本文中,我们允许回归中的误差包含自相关。例如,如果ηt'遵循ARIMA(1,1,1)模型,我们可以写成: 其中εt'是一个白噪声序列。 估计 在估计带有ARMA误差的回...

互联网时代,大量的新闻信息、网络交互、舆情信息以文本形式存储在数据库中,如何利用数据分析和文本挖掘的算法,将海量文本的价值挖掘出来,成为我们团队近期的一个研究方向,本案例就是我们的一个尝试。 文本聚类其实也就是聚类分析在文本方向上的应用,首先我们要把一个个文档的自然语言转换成数学信息,这样形成高维空间点之后再去计算点与点之间的距离,然后将这些距离比较近的聚成一个簇,这些簇的中心成为簇心。而我们做的就是保证簇内点的距离足够近,簇与簇的距离足够远。 本文将通过R语言帮助客户来实现文本挖掘、聚类和词云可视化技术,体验一下舆情分析的魅力。 原始评论数据 本文获取上海玛雅水公园景区评论数据共计1692条...

最近我们被客户要求撰写关于有限混合模型聚类FMM的研究报告,包括一些图形和统计输出。 摘要 有限混合模型是对未观察到的异质性建模或近似一般分布函数的流行方法。它们应用于许多不同的领域,例如天文学、生物学、医学或营销。本文给出了这些模型的概述以及许多应用示例。 介绍 有限混合模型是对未观察到的异质性建模或近似一般分布函数的流行方法。它们应用于许多不同的领域,例如天文学、生物学、医学或营销。最近的专着McLachlan和Peel(2000)以及Frühwirth-Schnatter(2006)中给出了这些模型的概述以及许多应用示例。 有限混合模型 有限混合模型由K个不同分量的凸组合给出,即分量的权...

数字化是复杂系统中的一个重要驱动因素,它得到了技术进步的支持。 随着以大数据、物联网、云计算、人工智能等为代表的数字技术的不断成长和成熟,企业必须应对的内外部环境发生了翻天覆地的变化。 新的全球生产力革命的一个关键驱动因素是数字智能化。企业的采购、生产、经营、销售等商业活动都是通过金融体系联系起来的。企业要想在数字时代复杂动态的环境中生存,理解如何实施金融数字化转型至关重要。一般来说,十项技术可以提高公司财务自动化和一体化的效果。 财税软件的市场是由企业的合规要求创造的,这些要求是由政策推动的。从2000年左右开始,经历了从简单的会计、税务软件到企业资源计划(ERP)的转变过程,在原有财务管...

 最近我们被客户要求撰写关于VAR模型的研究报告,包括一些图形和统计输出。 目录 模型与数据 估算值 预测误差脉冲响应 识别问题 正交脉冲响应 结构脉冲反应 广义脉冲响应 参考文献 脉冲响应分析是采用向量自回归模型的计量经济学分析中的重要一步。它们的主要目的是描述模型变量对一个或多个变量的冲击的演化。因此使它们成为评估经济时非常有用的工具。这篇文章介绍了VAR文献中常用的脉冲响应函数的概念和解释。 模型与数据 为了说明脉冲响应函数的概念,使用了Lütkepohl(2007)的示例。可以从教科书的网站上下载所需的数据集。它包含从1960年1季度到1982年4季度按季度和季节性调整的...

 最近我们被客户要求撰写关于MCMC的研究报告,包括一些图形和统计输出。 创建测试数据 第一步,我们创建一些测试数据,用来拟合我们的模型。我们假设预测变量和因变量之间存在线性关系,所以我们用线性模型并添加一些噪音。     trueA<5 trueB<0 trueSd<10 sampleSize<31 创建独立的x值 x<(-(sampleSize-1)/2):((sampleSize-1)/2) 根据ax+b+N(0,sd)创建因变量 y<trueAx+trueB+rnorm(n=sampleSize,me...

关注 更多

空空如也 ~ ~

粉丝 更多

空空如也 ~ ~