概述: Flink是由软件基金会开发的开源流处理框架 , 其核心是用Java和Scala编写的分布式流数据流引擎 。Flink以数据并行和流水线方式执行任意流数据程序 , Flink的流水线运行时系统可以执行批处理和流处理程序 。本文主要介绍Flink下使用Java和Scala程序分别实现塞缪尔·厄尔曼《青春》的词频统计 。
1、使用mvn命令创建Flink工程
【Flink实现词频统计】
文章插图
(1) Java模板
mvn archetype:generate -DarchetypeGroupId=org.apache.flink -DarchetypeArtifactId=flink-quickstart-java -DarchetypeVersion=1.8.0 -DarchetypeCatalog=local
文章插图
说明:需要自定义、和 , 如图
进入flink--java目录 , 查看生成的目录树
- Nginx日志记录访问信息
- 【一笔画完】通关路径算法的Java代码实现V2.0
- Kettle实现使用Http post组件实现钉钉机器人消息推送
- int n=10的sizeof 为什么是四_mongodb内核源码实现、性能调优
- Carla中实现车辆轨迹获得
- 小程序连接MYSQL实现增删改查
- Android 最流行的吸顶效果的实现及代码
- UFO-R6 HA集成ESP8266和涂鸦红外万能遥控器实现家庭影院一键放映
- Spring Security实现短信验证码登录
- cocos ceater 如何实现显示 Tip 的 同时能响应点击其他功能?