大数据云平台(学院商务大数据云平台软件开发)
项目概况
为顺应“新文科”理念下工商管理类人才培养要求,学院工商管理学院各专业进行“新文科”改造,需要建设商务大数据云平台,以满足工商管理、市场营销、电子商务等各专业实践教学课程和教研科研需要,为此需采购以下设备设施。
学院商务大数据云平台软件开发
总体要求
通过本项目建设,引入企业级双引擎商科大数据平台,既支持编程式大数据实验,又支持图形式大数据实验,让学生具有数据思维意识,掌了解大数据工具, 学会运用工具挖掘、分析大数据,锻炼应用实践能力。
本项目要求中标人满足各项技术指标要求,系统安全稳定,管理维护简单, 售后服务优良。
四、需求
序号 | 货物名称 | 技术参数及要求 | 数量 单位 | 所属行业 |
1 | 综合管理 | 平台为 C/S 架构,其功能包含课程管理、班级管理、教学(测 | 1 套 | 软件和信 |
序号 | 货物名称 | 技术参数及要求 | 数量 单位 | 所属行业 |
平台 | 试、问答等)管理、科研管理等内容如下: | 息技术服务业 | ||
1.平台客户端和服务端可以部署在不同的物理服务器之上。 | ||||
2.服务端须运行在主流 linux 操作系统之下,包括 CentOS、Re | ||||
dHat 等。 | ||||
3.客户端软件可以运行在 windows 操作系统之下,包括 window | ||||
s 7 以上版本。 | ||||
4.平台支持三类用户:管理员、教师和学生,分别有不同的权 | ||||
限。 | ||||
5.管理员可以添加新课程,支持个性化设置课程封面图片、课 | ||||
程名称,描述,作者等,支持编辑课程的教学目录结构,设置 | ||||
章和节。 | ||||
6.支持图文混排格式的电子教材,支持文档目录结构。 | ||||
7.支持不同类型的课件,包括教案 PPT,PDF,视频课件。支持 | ||||
添加不同类型的实验资源包,实验资源支持图文混排的实验指 | ||||
导书,实验建议时长(课时),实验数据,示例模型(程序代码 | ||||
/数据工作流)等。 | ||||
8.支持 docx 格式的教材和实验指导书上传,以及线编辑。 | ||||
9.支持通过课程编号、课程名称、课程描述、作者、联系方式 | ||||
等进行快速检索课程。 | ||||
10.支持 xlsx 文件格式批量导入教师用户、学生用户,也可以 | ||||
单个添加教师/学生用户。 | ||||
11.支持通过工号、姓名、性别、职称、联系方式快速检索教师 | ||||
用户。 | ||||
12.支持通过学号、姓名、性别、年级、联系方式对学生用户进 | ||||
行快速检索。支持教师和学生帐号的院系和班级设置。支持班 | ||||
级和课程的关联。 | ||||
13.支持每门课程实验所需数据的统一配置和管理。支持教师播 |
序号 | 货物名称 | 技术参数及要求 | 数量 单位 | 所属行业 |
放 ppt 教案,允许设置学生客户端是否同步播放。
| ||||
2 | 数据监管系统 | ★1.平台为 C/S 架构。教师和管理员可以对学生实验机集群管理,包含实验机创建、停止、销毁等。系统对集群内所有实验机进行监控,包含编号、所属服务器、创建时间、运行状态、开放端口。(提供系统截图加以证明)
★5.在实验过程中老师可以远程进入学生试验环境,可以远程指导学生实验。(提供系统截图加以证明) ★6.平台可以对学生学习行为进行记录和统计分析,可以显示 3 张独立完整的统计报表:(1)个人统计报表:统计开始时间、统计结束时间、登录次数、学习总时长、所学课程清单;(2)班级:统计开始时间、统计结束时间、平均每个学生登录次数、平均学习时长、所学课程清单;(3)全体:平均每个学生登录次数、平均学习时长、所学课程清单。上述三张统计报表要求每张报表包含规定的所有统计数据,能在一个界面展示。(提供系统截图加以证明) ★7.可以查看大数据平台硬件,包括 CPU 利用率、内存占用、 网络 IO、磁盘 IO 等状态。可以查看作业排队量和完成量。能够 | 1 套 | 软件和信息技术服务业 |
序号 | 货物名称 | 技术参数及要求 | 数量 单位 | 所属行业 |
显示平台用户登录的时间信息。显示在线用户量,累积在线时 长等信息。(提供系统截图加以证明) | ||||
3 | 数据市场系统 | 平台为 C/S 架构。支持数据上传、管理、发布等功能,为教师、学生账号提供数据类型展示、数据下载等用途。提供不少于 70 余个子行业的在线数据模板,用于教学过程中对于数据类型的学习、了解。每个数据模板至少包含描述、发布时间、发布单位、所属行业、数据格式、大小、以及详细的数据结构等信息。数据准备后,支持数据可视化跳转安全浏览器,数据市场系统内嵌软件,安全浏览器要求满足以下技术要求:
★3.兼容性检测工具,内置浏览器兼容性问题检测和修复工具, 并支持将修复资源通过管理后台统一策略下发至终端浏览器, 起到网页兼容性问题批量修复、达到正常的页面浏览效果;(提供系统截图加以证明) ★4.访问控制策略,支持访问控制策略,可设置允许在企业浏览器上访问的网站的白名单;(提供系统截图加以证明) ★5.国密网关管理,支持国密网关的管理配置,通过网关、应用系统的配置绑定,实现业务应用只能在企业浏览器上访问的功能;(提供系统截图加以证明) ★6.可信应用调用,支持对可信应用(如 wps 文档、表格、幻 | 1 套 | 软件和信息技术服务业 |
序号 | 货物名称 | 技术参数及要求 | 数量 单位 | 所属行业 |
灯片等)的白名单信任预处理,实现在浏览器中直接调用可信应用的便捷性操作;(提供系统截图加以证明) ★7.产品资质,产品具备第三方有权机构出具的产品测试报告 (提供第三方有权机构出具的检测报告的扫描件), 产品具备国家密码管理局颁发的商用密码产品认证证书(提供证书的扫描件) | ||||
4 | 编程式数据实验平台 |
Spark、R、Python、MongoDB、Kafka、HBase、MySQL、Impala 等。支持用户自主添加新类型的实验环境。 ★7.学生进入编程式大数据实验后,在实验过程中,可以隐藏和打开指导书。支持实验操作台支持隐藏和显示的工具栏显示试验机的服务器节点列表,通过鼠标点击可以自动切换到不同 服务器节点的桌面环境。(提供产品界面截图加以证 | 1 套 | 软件和信息技术服务业 |
序号 | 货物名称 | 技术参数及要求 | 数量 单位 | 所属行业 |
明)
| ||||
5 | ▲图形式数据实验平台 | 1.平台为 C/S 架构。图形式大数据实验平台支持图形化(鼠标拖拽)的方式进行教学/科研的大数据实验。 ★2.对于用户经常使用的数据组件,在客户端的主界面工具栏上显示快捷操作,可以在不进入组件面板的情况下直接拖拽使用。(提供产品界面截图加以证明)
| 1 套 | 软件和信息技术服务业 |
序号 | 货物名称 | 技术参数及要求 | 数量 单位 | 所属行业 |
据工作流,包括:数据源类型节点、转换类型节点、算法类型节点、和落地类型节点。要求每种类型的组件在工具栏上分组显示,可以通过鼠标拖拽来使用,可以设置工具栏的隐藏和关闭。 ★6.平台支持至少 13 种数据源功能包括:关系数据库、MongoD B、HDFS、FTP、文件夹、Hbase、系统 Hive、Cassandra、流、云文件、云数据库、课程文件、课程数据库。(提供产品界面截图加以证明) ★7.平台支持至少 6 种数据转换功能:包括通用转换、流转换、自定义、分组标签、抽样、行转列。(提供产品界面截图加以证明) ★8.支持图形化调用主流统计和数据挖掘算法,包括回归、支持向量机、朴素贝叶斯、关联规则、主成份分析、PLS、层次聚类、逐步回归、随机森林、Lasso 回归、神经网络、决策树、标准差、峰度、百分位数、移动平均、相关系数、单因素方差分析。(提供产品界面截图加以证明) ★9.平台支持 6 种数据落地功能,包括 ES 落地、HDFS 落地、I mpala 落地、Hive 落地、Cassandra 落地、云文件落地。(提供产品界面截图加以证明) ★10.提供调试运行功能,包括设置断点、设置目的地、校验元数据、设置查看器、设置落地的功能。启动调试任务后,可以推送相匹配的调试日志。调试日志以三类图标显示:错误信息红色图标、警告信息黄色图标、一般信息黑色图标。支持通过日志信息快速定位到关联的工作流节点的功能。 11.支持以树形结构显示大数据项目、大数据工作流、工作流节点、工作流节点元数据、支持元数据名字和类型和长度的显示。 ★12.可以对数据工作流设置调度任务。支持工作流调度的启 |
序号 | 货物名称 | 技术参数及要求 | 数量 单位 | 所属行业 |
动、暂停、停止、删除。调度规则支持 cron 表达式,可以设置邮箱发送调度信息,可以查看历史调度日志。可以对流式的数据工作流单独设置作业调度。(提供产品界面截图加以证明) ★13.关系型数据节点支持对以下信息的配置:IP、端口号、用户名、密码、数据库类型,支持实时显示数据库表的元数据, 包括:主键,列名,类型,长度,精确度,小数点位数,可否为空,是否唯一,以及比对。(提供产品界面截图加以证明)
★17.文档抽取数据节点支持对以下信息的配置:行格式、分隔符、字段长度、标题行号、第一行数据行号、行分隔符、行分隔符位置、后处理、合并所有。(提供产品界面截图加以证明) 18.XML 抽取数据节点支持对以下信息的配置:xsd 文件、合并 所有、xsd 文件路径、后处理。 |
序号 | 货物名称 | 技术参数及要求 | 数量 单位 | 所属行业 |
21、大数据平台支持图形式读取非关系数据库/数据源包括 Mon goDB、HDFS、FTP、共享文件夹、Hbase、Cassendra、Kafaka。22、数据挖掘节点支持在创建时由系统自动化生成训练转换器, 以方便训练数据导入。 23.支持以图形式操作把实验的中间结果和最终结果写入到关系型数据库包括 DB2,Oracle,SQL Server, Hana,TeraData, RedShift;也可以写入到非关系型数据库:Elastic Search、H DFS、Impala、Hive、Cassandra。 ★24.支持表达式编辑器,用 ANSI SQL 脚本书写,在数据节点的过滤条件和数据集关联条件中可以进行配置,支持智能输入提示,用户手工输入一个对象的前几个字符,则自动弹出下拉列表。(提供产品界面截图加以证明)
k 大数据计算框架,支持 Cloudera 和 Apache 版本的 Hadoop/s park。大数据平台的服务端模支持 CentOS,RedHat 等主流 lin ux 系统。
理功能模块和数据挖掘模块。自定义模块可以集成到用户通过鼠标拖拽方式开发的数据工作流之中。 |
序号 | 货物名称 | 技术参数及要求 | 数量 单位 | 所属行业 |
捕获节点,当出现数据异常时,数据自动分流,以方便排错和差异化处理。要求异常数据处理节点的列属性包括所对应数据 |
序号 | 货物名称 | 技术参数及要求 | 数量 单位 | 所属行业 |
节点的所有上游数据节点的列,同时自动创建一个 ERROR 列, 用于捕获具体的错误信息。 33、支持多人同时登录,团队协作开发,在一个工作流被一个用户打开后,对其他用户能够自动加锁,防止冲突。 ★34.支持常见的数据聚合功能,包括平均值、最大值、最小值、数值求和(sum)、字符串累加、计数等。(提供产品 界面截图加以证明) | ||||
6 | 数据可视化平台 |
★5.支持区域地图、点地图、流向地图、热力地图,可进行省、市、县级别的地图数据分析,同时支持用户直接在浏览器前端进行地图自定义设计,包括地理地图、自定义图片地图、自定义 GIS 地图背景、地理位置和经纬度自定义匹配等功能,帮助用户进行快速自定义地图编辑设计。(提供产品界面 截图加以证明) | 1 套 | 软件和信息技术服务业 |
序号 | 货物名称 | 技术参数及要求 | 数量 单位 | 所属行业 |
6.支持日期、日期区间、年份、年月、年季度类型的时间过滤控件;支持单选或多选文下拉、文本标签、文本列表类型的文本过滤控件;支持下拉树、树标签、树列表类型的树过滤控件; 支持数值区间、区间滑块类型的数值控件,同时支持复合查询控件,可进行复杂且或组合逻辑过滤;支持控件可指定特定组件进行数据过滤。 ★7.支持 web 组件,可进行网页 url 嵌入分析;支持图片组件, 可嵌入图片进行分析展现;支持富文本组件,可输入文字和动态字段进行复合信息展现,支持 word 级别的字体大小、颜色、对齐等属性调节。(提供产品界面截图加以证明) ★8.支持查询按钮,可实现点击查询按钮之后方进行数据查询, 重置按钮实现点击重置按钮清空所有过滤条件。(提供产品界面截图加以证明)
★11.支持组件复制,在同一个仪表板中进行组件复制;支持组件复用,可复用不同仪表板中的组件。(提供产品界面截图加以证明) 12.支持动态字段作为参数在组件标题中使用,实现灵活的动态标题显示功能,如A 组件和 B 组件联动,如点击A 组件中的“X X 省”联动到 B 组件进行过滤时,B 组件动态命名为“XX 省销售情况统计”作为标题进行显示。 13.支持图表添加文字或图片注释以及闪烁动画,可由用户自由 |
序号 | 货物名称 | 技术参数及要求 | 数量 单位 | 所属行业 |
定义条件进行动态展示。 14.支持用户创建的模板进行多层分组,可以批量删除,移动, 方便用户对于模板的有效管理,普通用户可以将模板分享给其他部门-岗位或者角色的用户,普通用户自己制作的模板,在制作完成后,可以申请给超级管理员挂至目录树节点给其他用户查看。 ★15.支持用户给已经完成的模板创建任何人都可以访问公开链接,便于即时进行公开分享。(提供产品界面截图加以证明) ★16.支持直接对维度和指标进行排序、对指标进行排名、计算组内累计值以及累计值、计算组内所有值以及所有值,快速计算同比、环比、同期、环期,支持使用记录数对维度进行计数, 对指标快速进行求和、求最大值、最小值、平均值、中位数、标准差、方差、占比等,无需书写任何公式。(提供产品界面截图加以证明) 17.支持丰富的函数运算,如字段拼接、类型转换、if 运算,s witch 运算等常用 Excel 形式的函数,支持通过变量之间聚合的运算新增指标。 ★18.支持对分组表和交叉表自动进行行列汇总计算,支持行列的定义合计方式,如求和、最大值、平均值、最小值、中位数、标准差、方差。(提供产品界面截图加以证明)
|
序号 | 货物名称 | 技术参数及要求 | 数量 单位 | 所属行业 |
形进行数据层级钻取。
OGO 等的自定义行为。 ★26.支持设置钻取目录,实现预览分析时对数据进行维度转换操作。(提供产品界面截图加以证明)
aders 三部分
★29.支持短信平台功能,并可用于用户账号身份验证、内存阀值通知(如设置触发条件,服务器内存高于 xx%并且持续 xx 分钟时,触发收件人进行短信提醒功能)。(提供产品界面截图加以证明) 30.支持仪表板的定时作业调度,将生成的仪表板以文件形式导 出定时推送给相关角色或者部门人员,支持客户端推送、邮件推送以及 APP 推送。 | ||||
7 | 《大数据理论基础 与应用实 | ★每一门课程要求提供理论教学所需要的 PPT,以及配套的实验。每一个实验要求提供实验指导书、说明详细的实验步骤、 实验需要的数据、以及示例代码或模型。对于关键性实验提供 | 1 套 | 软件和信息技术服 务业 |
序号 | 货物名称 | 技术参数及要求 | 数量 单位 | 所属行业 |
战》资源包 | 实验高清视频。资源至少包括: | |||
★项目一:销量随年份如何变化?任务(一)探索销售数据, | ||||
实验(I)探索销售数据,实验(II)汇集销售数据到数据湖, | ||||
任务(二) 销售数据加工,实验(I)销售表数据去重、空值 | ||||
处理,实验(II)根据产品单价和订货量计算每单,任务(三) | ||||
统计每年销售收入,实验(I)统计每年销售收入,任务(四) | ||||
各年份销售总额可视化展示 分布条形图和表视图,实验(I) | ||||
全年订货总价分布条形图与表视图。 | ||||
★项目二:购买的顾客有哪些特征?任务(一)购买的用户特 | ||||
征,实验(I)购买的用户特征,实验(II)购买顾客聚类。 | ||||
★项目三:如何设计一个爆款产品?,任务(一)如何设计一 | ||||
个爆款产品,实验(I)如何设计一个爆款产品。 | ||||
项目四:采购部门如何精确预测某配件的需求量,任务(一) | ||||
配件采购预测,实验(I)用移动平均算法预测配件采购量。 | ||||
项目五:市场部如何合理选择销售实体店位置,任务(一)实 | ||||
体店收入数据加工,实验(I)实体店收入数据加工,实验(II) | ||||
每个实体店的总收入可视化,实验(III)人口、实体店数据、 | ||||
商业数据,实验(IV)城市类型与实体店销售总收入可,实验 | ||||
(V)实体店销售收入数据训练 Lass,实验(VI)预测候选实体 | ||||
店的销售收入,实验(VII) 预测销售收入可视化。 | ||||
★项目六:市场部选择广告投放方案,任务(一)购买产品的 | ||||
顾客有哪些特征?,实验(I)用线性回归选择广告投放方案。 | ||||
★项目七:如何进行产品精准营销?任务(一)性别、年收入、 | ||||
年龄是否影响购买,实验(I)性别、年收入是否影响购买自行, | ||||
实验(Ⅱ)年收入对产品购买结果的影响,实验(Ⅲ)客户年 | ||||
龄离散化,实验(Ⅳ)年龄是否影响购买产品,任务(二)用 | ||||
神经网络发现潜在购买产品客户,实验(I)用神经网络发现潜 |
序号 | 货物名称 | 技术参数及要求 | 数量 单位 | 所属行业 |
在购买产品。 项目八:客服部对客服人员绩效评估量化,任务(一)客服人员效绩评估量化,实验(I)客服人员效绩评估量化。 ★项目九:网销部如何进行网络公关?任务(一)产品评论情感分析及可视化,实验(I)产品评论情感建模,实验(II)产品评论词云图。 项目十:财务部门如何监控财务状况,任务(一)财务数据可视化,实验(I)可视化准备-数据落地到个人库,实验(Ⅱ) 五大财务比率可视化-分布条形,实验(Ⅲ)公司利润表可视化 -气泡图,实验(Ⅳ)现金流量表可视化-时间序列折线。 项目十一:法务部门事故产品理赔预测,任务(一)用决策树审核交通事故是否理赔,实验(I)计算交通事故理赔数据的相关,实验(II)用决策树审核交通事故是否、 项目十二:人事部门如何通过大数据进行离职预警,任务(一) 企业员工离职预警,实验(I)企业员工离职预警。 | ||||
8 | 《营销大数据融合教学案 例》资源包 | 每一个实验要求提供实验指导书、说明详细的实验步骤、实验需要的数据、以及示例代码或模型。 资源至少包括: 项目一:市场需求分析:家政市场需求分析; 项目二:目标客户群体分析:奶产品目标客户群体分析; 项目三:论坛营销:通过网上客户评论进行情感分析; ★项目四:自媒体营销:自媒体文章词云图分析; ★项目五:微博营销:影响大V 的关键因素分析; 项目六:网络营销环境调研:网民分析; ★项目七:网络消费者行为:抽取用户表并通过用户信息给用户打标签、用户商品购买关联规则; ★项目八:网络营销价格策略:根据同类商品价格定价、分析 | 1 套 | 软件和信息技术服务业 |
序号 | 货物名称 | 技术参数及要求 | 数量 单位 | 所属行业 |
电商平台热门商品; ★项目九:网络营销渠道策略:银行营销活动精准营销、推广位选择; 项目十:网络营销广告策略:匿名分类特征量化、历史广告点击数据模型训练、广告点击率预测; ★项目十一:推广访问量统计分析:PV 分析、UV(日活,月活) 分析、留存预警、转化分析; 项目十二:商品调价模型:书包价格数据可视化、计算书包价格调整的幅度百分比; ★项目十三:品牌舆情:通过社交数据进行品牌口碑分析; 项目十四:客户生命周期分析:用户价值分析(RFM) | ||||
9 | 《电子商务大数据融合教学案例》资源包 | 每一个实验要求提供实验指导书、说明详细的实验步骤、实验需要的数据、以及示例代码或模型。 资源至少包括: ★项目一:电商平台数据分析:母婴用品销量分析、电商用户访问行为分析; ★项目二:网络营销环境调研:根据同类商品价格定价、用户购买商品关联规则分析; 项目三:网络营销策略:预测二手车平台上车的价格、推广位统计分析、广告点击预测、预测网上购物者购买意向; ★项目四:客户管理:电商店铺客户画像、RFM 用户聚类分析; 项目五:售后用户分析:用户评论分析、评论情感分析建模和评价; 项目六:供应链风险分析:用决策树预测供应链订单是否会延期; 项目七:物流管理与分析:选择费用最低的快递公司; 项目八:电子商务支付与安全:电商支付方式统计分析、利用 | 1 套 | 软件和信息技术服务业 |
序号 | 货物名称 | 技术参数及要求 | 数量 单位 | 所属行业 |
多层感知机识别支付是否安全。 | ||||
10 | 《物流大数据融合教学案 例》资源包 | 每一个实验要求提供实验指导书、说明详细的实验步骤、实验需要的数据、以及示例代码或模型。 资源至少包括: 项目一:农作物物流分布:全国 XX 产量分布分析; 项目二:物流需求预测分析:预测 XX 年 XX 货邮吞吐量; 项目三:供应链关系:供应关系分析; 项目四:采购预算:用移动平均算法预测配件采购量; 项目五:运输成本分析:选择费用最低的快递公司、快递成本可视化、物流运送量分析驾驶舱、物流赢利分析驾驶舱; 项目六:配送中心选址分析:预测新建配送中心位置; 项目七:配送管理:预测配送优先级、根据货主需求推荐车辆、物流公司装货时间预测; 项目八:快递点分布:XX 快递网点分布; 项目九:物流客户画像:货主客户画像; 项目十:物流企业客户舆情分析:物流投诉分析、物流投诉热 词词频统计、物流投诉分析驾驶舱 | 1 套 | 软件和信息技术服务业 |
11 | 《人力资源大数据融合教学案例》资源包 | 每一个实验要求提供实验指导书、说明详细的实验步骤、实验需要的数据、以及示例代码或模型。 资源至少包括: 项目一:招聘与配置:招聘结果分析、招聘过程漏斗; 项目二:人员能力测评:预测面试人员工作能力; 项目三:绩效管理:使用固定值作为平均销售额的 KOI 指标、三年同期销售分析、销售数据行列转换、使用实例平均月销售额作为本期 KPI 指标; 项目四:薪酬管理:收入是否超支; 项目五:员工关系管理:员工满意度模型训练、员工满意度模 | 1 套 | 软件和信息技术服务业 |
序号 | 货物名称 | 技术参数及要求 | 数量 单位 | 所属行业 |
型预测; 项目六:员工兴趣爱好聚类:员工兴趣爱好聚类; 项目七:企业员工离职预警:企业员工离职预警; 项目八:劳动管理管理:劳动关系文本分类分析 | ||||
12 | 《金融、保险大数据融合教学案例》资源包 | 每一个实验要求提供实验指导书、说明详细的实验步骤、实验需要的数据、以及示例代码或模型。 资源至少包括: 项目一:利用大数据的投资分析:投资项目数据_缺失值处理、投资项目数据加工_统一币种金额、分析国内股权投资发展经历、历年风投行业偏好热力图、各年份投资轮次偏好热力图、最活跃投资机构排行、细分行业投资排行、各币种累计投资金额、累计投资金额热力地图; 项目二:利用大数据分析投资回报率:投资回报率_计算平均投资额、投资回报率_建模数据预处理、投资回报率_量化、投资回报率_建模、投资回报率_预测数据预处理、投资回报率_预测; 项目三:利用大数据评估投资回报价值:评估公司投资价值是否被高估或低估_数据预处理、评估公司投资价值是否被高估或低估_量化、评估公司投资价值是否被高估或低估_建模、评估公司投资价值是否被高估或低估_预测; 项目四:投资组合的收益计算:投资组合收益、投资组合内的股票相关性分析、随机组合投资风险与收益、最优投资组合; 项目五:社会舆情对股票指数的影响:新闻标题数据预处理、统计热词词频、计算日热词与前一周热词重复数、热词重复数与股票指数线性回归分析; 项目六:商业银行贷款风控:导入原始业务数据、理解原始数据、丢失属性的处理、挖据预处理-标准化、建立风控预测模型、 数据可视化:贷款审批结果输出、模型预测评价; | 1 套 | 软件和信息技术服务业 |
序号 | 货物名称 | 技术参数及要求 | 数量 单位 | 所属行业 |
项目七:信用卡逾期侦测分析:信用卡数据探索 1_描述统计、信用卡数据探索 2_标准差、信用卡数据预处理_缺失值替换、贷款人群年龄分布、信用卡数据探索_月收入分布、信用卡逾期的高发人群分析、属性特征与是否逾期的相关性分析、训练逻辑回归模型、信用卡测试数据探索和缺失值替换、逻辑回归模型 预测是否逾期。 | ||||
13 | 《数据源与数据 湖》资源包 | 每一门课程要求提供理论教学所需要的 PPT,以及配套的实验。每一个实验要求提供实验指导书、说明详细的实验步骤、实验需要的数据、以及示例代码或模型。对于关键性实验提供实验高清视频。资源至少包括:
★实验清单:Ubuntu 安装 MySQL、关系型数据库 MySQL 数据库运行环境、MySQL 插入带约束的学生信息、Java 使用 MySQL 事务写入学生信息、MYSQL 导出导入学生数据、MySQL 创建学生信息表、用 Java 语言读取学生信息表元数据、MYSQL 查询学生信 息、MySQL 更新与删除学生信息-Java、MySQL 分区写入销售数 | 1 套 | 软件和信息技术服务业 |
序号 | 货物名称 | 技术参数及要求 | 数量 单位 | 所属行业 |
据、MySQL 删除和修改学生表约束、MySQL 更新与删除学生信息、 MYSQL 从视图查询学生信息、MYSQL 多表联合操作实验、用 MYS QL 语言读取学生信息表元数据、MySQL 使用事务语言写入学生信息、关系型数据库运行环境、mongodb 安装、mongodb 写入、 mongodb 创建索引、mongodb 普通查询、mongodb 高级查询、mo ngodb 的修改与删除、ActiveMQ 安装及环境配置、ActiveMQ 点对点传输模式、ActiveMQ 发布订阅模式、安装 kafka、kafka 消息读写、Tomacat 部署及发布、通过爬虫抓取网络图片、通过T CPIP 协议实现客户端与服务端通信、java 实现 http 通信、获 取 12306 火车车票信息、通过 API 获取天气信息。 | ||||
14 | 《数据加工》资源包 | 每一门课程要求提供理论教学所需要的 PPT,以及配套的实验。每一个实验要求提供实验指导书、说明详细的实验步骤、实验需要的数据、以及示例代码或模型。对于关键性实验提供实验高清视频。 资源至少包括: (1)选择(2)变换、条件判断(3)关联(4)聚合、排序(5) 窗口(6)标签(7)旋转(8)缺值处理(9)数据冲突处理、数据探索(10)数据画像(11)数据抽样、数据统计描述(12) 数据相似性(13)数据异常(14)数据去重(15)维规约、数值规约(16)噪音数据(17)数据量化(18)数据离散化。 ★实验清单至少:获取语文成绩至少 100 分的学生、获取语文 成绩至少 100 分的学生-py、从网络日志中提取用户访问页面、从身份证号中获取用户信息、从天气数据中获取地区和温度、通过用户身份证号判断用户性别、对学生英语成绩进行分类、从网络日志中提取用户访问页面-py、从身份证号中获取用户信息-py、从天气数据中获取地区和温度-py、通过用户身份证号 判断用户性别-py、对学生英语成绩进行分类-py、通过用户身 | 1 套 | 软件和信息技术服务业 |
序号 | 货物名称 | 技术参数及要求 | 数量 单位 | 所属行业 |
份证号获取户口所在地、通过用户身份证号获取户口所在地-p y、各班成绩聚合查询、用户访问所有页面汇总、各班成绩聚合查询-py、用户访问所有页面汇总-py、航班飞行数据打标签、学生成绩表格行转列、学生成绩缺值替换、数据缺值删除、单值个数统计、数据冲突处理之计算非空值百分比、房屋价格标准差、城镇人均犯罪率与业主自用房价因素方差分析、业主自用房价格中位数(MEDV)的分位值、房价峰度计算、城镇人均犯罪率与业主自用房价相关系数分析、业主自用房价的移动平均值、用户年收入数据画像、用户查询词数据画像、鸢尾花抽样、数据相似性计算、年龄中异常数据的检测、去除年龄中的异常数据、鸢尾花种类去重、鸢尾花特征主成分分析、鸢尾花特征线性回归、鸢尾花特征主成分分析-py、鸢尾花特征线性回归-py、量化用户上班距离、量化用户上班距离-py、年龄离散 化、年龄离散化-py。 | ||||
15 | 《数据分析与挖 掘》资源包 | 每一门课程要求提供理论教学所需要的 PPT,以及配套的实验。每一个实验要求提供实验指导书、说明详细的实验步骤、实验需要的数据、以及示例代码或模型。对于关键性实验提供实验高清视频。 资源至少包括: (1)描述性统计分析、(2)时间序列分析、(3)单因素方差分析、(4)数据正规化、(5)主成分分析、(6)线性回归、逐步回归、(7)偏最小二乘回归、(8)逻辑回归分析、(9)聚类、(1 0)朴素贝叶斯、(11)支持向量机、(12)神经网络、(13)关联规则、(14)决策树、(15)随机森林。 ★实验清单:鸢尾花的描述性统计分析、鸢尾花的统计综合指数分析、鸢尾花的统计平均指数分析、鸢尾花的众数统计分析、 鸢尾花的中位数统计分析、鸢尾花的方差统计分析、鸢尾花的 | 1 套 | 软件和信息技术服务业 |
序号 | 货物名称 | 技术参数及要求 | 数量 单位 | 所属行业 |
标准差统计分析、计算鸢尾花的峰度、计算鸢尾花的相关系数、计算上海房价的百分位数、鸢尾花的描述性统计分析-python、鸢尾花的众数统计分析-python、鸢尾花的中位数统计分析-pyt hon、计算鸢尾花的相关系数-python、计算鸢尾花的峰度与偏度-python、计算上海房价的百分位数-python、用移动平均法预测房价、用移动平均法预测人均 GDP、用移动平均法预测房价 -python、用移动平均法预测人均 GDP-python、水稻不同品种亩产量的单因素方差分析、水稻不同品种亩产量的单因素方差分析-py、鸢尾花数据的正规化、鸢尾花数据的正规化-python、青蛙叫声数据的主成分分析、青蛙叫声数据的主成分分析-pyth on、用线性回归预测足球运动员身价、用线性回归预测发电站电力输出、用线性回归预估商品的销售额、对工资水平进行逐步回归、用岭回归预测街道上公共产品使用量、用 Lasso 回归预测房价、用线性回归预测足球运动员身价-py、用线性回归预测发电站电力输出-py、用线性回归预估商品的销售额-py、用岭回归预测街道上公共产品使用量-py、用 Lasso 回归预测房价 -py、用偏最小二乘预测楼房的能源效率、用偏最小二乘预测楼房的能源效率-py、用逻辑回归对鸢尾花进行分类、用逻辑回归对鸢尾花进行分类-py、用层次聚类分析电信用户信用、用 K-M eans 细分青少年兴趣、用层次聚类分析电信用户信用-py、用 K -Means 细分青少年兴趣-py、用朴素贝叶斯判断是否接受贷款申请、用朴素贝叶斯判断是否接受贷款申请-py、用支持向量机判别是否是矿石、用支持向量机判别是否是矿石-py、用神经网络判别小麦种子等级、用神经网络诊断是否是乳腺癌、用神经网络判别人体活动、用神经网络判别小麦种子等级-py、用神经网络诊断是否是乳腺癌-py、用神经网络判别人体活动-py、互联 网日志关联分析、互联网日志关联分析-py、用决策树判断电离 |
序号 | 货物名称 | 技术参数及要求 | 数量 单位 | 所属行业 |
层的好坏、用决策树审核交通事故是否理赔、用决策树发现银行即将流失的客户、用决策树评估个人信贷信用好坏、用决策树判断电离层的好坏-py、用决策树审核交通事故是否理赔-py、用决策树发现银行即将流失的客户-py、用决策树评估个人信贷信用好坏-py、用随机森林预测鲍鱼环的数量、用随机森林判断青少年运动障碍、用随机森林判别红酒品质、用随机森林建议地震损毁建筑的修复方案、用随机森林预测鲍鱼环的数量-py、用随机森林判断青少年运动障碍-py、用随机森林判别红酒品质 -py、用随机森林建议地震损毁建筑修复方案-py。 | ||||
16 | 《数据可视化》资源包 | 每一门课程要求提供理论教学所需要的 PPT,以及配套的实验。每一个实验要求提供实验指导书、说明详细的实验步骤、实验需要的数据、以及示例代码或模型。对于关键性实验提供实验高清视频。 ★资源至少包括:(1)可视化的释义、(2)可视化简史、(3)数据可视化基础框架、(4)可视化中的数据、(5)可视化设计原则、(6)可视化理论发展、(7)可视化准备、(8)分组表: 统计不同合同类型和付款类型下的合同金额、(9)交叉表:统计不同年份下不同合同类型和付款类型的合同金额、(10)明细表:统计合同签约明细数据、(11)柱形图:比较年度合同总额、 (12)点图:总览月合同金额、(13)热力点图:从颜色分析用户类型与年龄的分布、(14)线形图:观察注册人数随时间的变化趋势、(15)面积图:观察不同平台下的用户浏览量随时间的变化趋势、(16)矩形块图:分析不同平台和不同阶段的网站访问时间分布、(17)饼图:分析网站在不同阶段的访问时间占比情况、(18)文本图:使用词云图分析网站搜索的关键词、(19) 地图:观察不同城市的销售情况、(20)漏斗图:平台用户访问 阶段漏斗转化分析、(21)仪表盘:观察平台用户访问时间达标 | 1 套 | 软件和信息技术服务业 |
序号 | 货物名称 | 技术参数及要求 | 数量 单位 | 所属行业 |
率、(22)气泡图、(23)雷达图。 | ||||
17 | 《python 》资源包 | 每一门课程要求提供理论教学所需要的 PPT,以及配套的实验。每一个实验要求提供实验指导书、说明详细的实验步骤、实验需要的数据、以及示例代码或模型。对于关键性实验提供实验高清视频。 ★资源至少包括:(1)开发 Python 环境:Spyder 开发 Python环境、(2)wordcount、(3)Python 语言基础:输入输出操作、数据类型和变量、字符串和编码、使用 list 和 tuple、dict 和 set、高级特性(切片、迭代、列表生成式、生成器)、条件判断和循环语句、函数、(4)Python 语言统计建模:数据导入、数据结构、数据切片、描述性统计、可视化处理、Numpy 库操作、 Scipy 库操作、Pandas 库操作、Sciki-learn 库操作、(5)Pyt hon 可视化、(6)机器学习算法导论、(7)Sklearn 机器学习入门、(8)数据降维:MNIST 手写数字图片降维、(9)随机森林: 使用随机森林进行红酒品质分类、用随机森林判断青少年运动障碍、用随机森林通过青蛙叫声判断类别、用随机森林预测产品需求量(10)决策树:用决策树评估个人的信用卡信用好坏、用决策树判断是否接受贷款申请、用决策树发现银行即将流失的客户(11)K 近邻:使用 K 近邻诊断疾病、(12)时间序列分析:航班乘客时间序列分析(13)聚类:用 K-Means 细分消费者兴趣、用K-Means 聚类分析电信用户信用(14)支持向量机: 用 SVC 进行人脸识别、(15)关联规则:用神经网络判断小麦种子等级、用神经网络预测人体活动、用神经网络预测网络新闻流行度、用神经网络判别是否是矿石、用神经网络判断是否推荐衣服(16)线性回归:用线性回归预估商品的销售额、用线性回归预估商品的销售额(17)偏最小二乘:用偏最小二乘预 测楼房的能源效率(18)深度学习:用 Tesorflow 识别手写数 | 1 套 | 软件和信息技术服务业 |
序号 | 货物名称 | 技术参数及要求 | 数量 单位 | 所属行业 |
字、用 Tesorflow 识别手写数字进阶 | ||||
18 | 数据创新应用平台 |
★3.每一个科研项目可以设置一个项目主页,展示项目组长、项目简介等基本信息。(提供产品界面截图加以证明)
以将项目设置为公开或私有,公开的项目,系统的任何用户都可以浏览项目信息。 | 1 套 | 软件和信息技术服务业 |
19 | 终端安全管理系统 | 1.平台为 C/S 架构。操作系统支持:Windows XP_SP3 及以上/W indows Vista/Windows 7/Windows 8/Windows 10、Windows Se rver 2003_SP2/Windows Server 2008/Windows Server 2012/ | 1 套 | 软件和信息技术服 务业 |
序号 | 货物名称 | 技术参数及要求 | 数量 单位 | 所属行业 |
Windows Server 2016、中标麒麟/银河麒麟/Deepin/中科方德/ SUSE Linux/Red Hat Linux/centOS/Ubuntu 12 以上版本 2.控制中心:采用 B/S 架构管理端,具备设备分组管理、策略制定下发、全网健康状况监测、统一杀毒、统一漏洞修复、网络流量管理、终端软件管理、硬件资产管理以及各种报表和查询等功能。 ★3.支持自主授权分割功能,管理员可以从主系统中心分割授权客户机数量给下级系统中心,限制下级系统中心对客户机的注册数量,阻止非法客户机注册。(提供系统截图加 以证明) ★4.支持多种分组规则,如 IP 分组以及支持与 AD、LDAP 同步功能,可将用户组织架构同步到终端安全管理系统中,依照用户现有架构进行管理。分组支持无限层次分组,支持生成组安装包,安装后自动进入该分组。(提供系统截图加以证明) 5.具有移动终端防护软件,并可接入系统中心平台进行统一管理(提供系统截图加以证明) ★6.支持浏览器防护,对篡改浏览器设置的恶意行为进行有效防御,并可以锁定默认浏览器设置(提供系统截图 加以证明) 7.要求支持通过数字签名或者文件名的方式分别显示文件,方便管理员管理全网终端上报的文件;(提供系统截图加以证明) ★8.支持文件解压缩病毒查杀,支持对 zip、rar、7z 等多种格式的压缩文件查杀能力;默认支持 32 层压缩扫描,且用户可以自定义设置扫描层数(提供系统截图加以证明) 9.可以提供对各类即时通讯工具、邮件、网络下载工具、文件, |
序号 | 货物名称 | 技术参数及要求 | 数量 单位 | 所属行业 |
文件类型至少支持.dll、scr、rtf、pps、zip、MP4、AVI、wmv、 RMVB、psd、jpeg、bat、cfg,apk、lnk 等保存到本地文件的查杀功能,并进行文件审计,可查看文件审计列表,并可对任意审计文件进行追溯(提供系统截图加以证明)
★13.支持宏病毒程序行为监测;并能够提供详尽的分析报告。支持的文件类型,必须覆盖:PE 类文件(EXE、DLL、OCX、SYS、 COM);文档类文件(OFFICE、WPS、PDF、RTF、FLASH);压缩文件(7z、apk、arj、bz2、cab、exe、gzip、lzh、rar、zip); 图片文件(GIF、JPEG);报告中能够提供动态运行样本的截图, (提供样本截图)。能够提供样本文件的 EXIF(Exc hangeable Information)信息作为判定参考,(提供样本截图),拥有事件关联分析能力:基于历史数据、威胁分布、脆弱性分析结果的综合判别能力; ★14.支持与边界恶意代码检测设备、防火墙、文档智能管理平 台,未知威胁检测系统联动,达到网关边界联动防御效果(提供系统截图加以证明) |