Java的加载执行过程
正则表达式就是记录文本规则的代码。
正则表达式
正则表达式就是记录文本规则的代码。
Java常用的八种排序
我们写程序的时候经常碰到排序问题,这里总结下。
Leetcode记录
刷力扣(LeetCode)
深入 Git
Git 是目前世界上最先进的分布式版本控制系统。
初识 Git
WSL2 在 Windows 上提供 Linux 环境,利用 Hyper-V 和完整的 Linux 内核。
Git基本语法
WSL2 在 Windows 上提供 Linux 环境,利用 Hyper-V 和完整的 Linux 内核。
Hello World
Welcome to Hexo! This is your very first post. Check documentation for more info. If you get any problems when using Hexo, you can find the answer in troubleshooting or you can ask me on GitHub.
GPT推荐
学习英语 Pi, your personal AI
Quick StartCreate a new post1$ hexo new "My New Post"
More info: Writing
Run server1$ hexo server
More info: Server
Generate static files1$ hexo generate
More info: Generating
Deploy to remote sites1$ hexo deploy
More info: Deployment
spark01
回顾
大数据生态: 解决的问题: 分布式存储和分布式计算
Google:GFS / MapReduce / Bigtable
基于三篇论文,产生了hadoop
hdfs: 分布式的存储
MapReduce: 计算框架(离线计算)
facebook创建hive,SQL-ON_Hadoop,数据仓库的标准
(以上的效率低,延时高)
基于bigtable的hbase出现,(百万级别列,上10亿的行)
辅助工具:
flume: 日志收集工具
sqoop:rdb关系型数据库 <—> hdfs
Kafka: 消息队列
azkaban:作业的调度
zookeeper:
**zookeeper:**zookeeper做资源协调调度 比如hdfs-ha选举
azkaban:做任务调度task,比如mrjob的调度
再简单一点zookeeper调度的是集群内部的各个节点
azkaban调度的是俺们自己写的mr job
大数据计算
三大计算中心
离线计算(离线批处理)mapreduce 慢
实时计算(事件计算) ...
hbase
sql: 结构化查询语言,针对于二维表格的一种脚本语言
Nosqll: 这个类型的数据的数据存储格式:key-value
用一句话总结: 能使用sql语法进行增删改查的数据库就是sql数据库,否则就是nosql数据库
所谓的nosql数据库就是一个很大很大的map
Nosql:No sql
NoSQL: Not only SQL(基于各种nosql数据库都有sql客户端)
hbase: put delete put get scan
sql客户端: 用户编写的sql 这个工具帮助把这个sql转换成hbase认识的命令
hadoop是什么东西
平台
hdfs mapreducea yarn
ntfs qq eclispse chrome windows(操作系统:桥梁 把软件所需要做的硬件资源进行管理 )
一个完整的计算机:
操作系统
文件系统
提供一个计算模型 编写软件运行计算任务
一个完整的计算集群:—-> 一台强大的服务器
功能: 把多个服务器组合在一起,形成一个整体
对于hadoop用户,不需要了解hadoop到底由多少台服务组成
我们只需要认为我们使用 ...