使用 hive

hive使用

162 次访问 2020-09-08

东东

hive简介

Hive是基于Hadoop的一个数据仓库工具。本质是将HQL（Hive的查询语言）转化成MapReduce程序。

HIve处理的数据存储在HDFS
HIve分析数据底层的默认实现是MapReduce
执行程序运行在Yarn上

启动服务

进入hive的bin目录下，./hiveserver2 start启动服务

进入客户端

bin目录下，./hive进入

数据文件导入到表

LOAD DATA INPATH '/dd/xq4_10w.txt' OVERWRITE INTO TABLE dddb.xq4;

创建数据库

create database dd;

删除

hive不支持delete，可以用insert overwrite代替

insert overwrite table xq4 select * from xq4 where id<10;

删除分区表部分数据

insert overwrite table xq4 partition(p1='aaa') select id,name from xq4 where p1='aaa' and id!=10;

p1为分区字段
where条件中过滤的是需要保留的数据
不能使用select *，会报字段对不上的错误，如下

Error: Error while compiling statement: FAILED: SemanticException [Error 10044]: Line 1:23 Cannot insert into target table because column number/types are different 'aaa': Table insclause-0 has 2 columns, but query has 3 columns. (state=42000,code=10044)

新增、修改、查询数据

基本和sql一样

建表

CREATE TABLE IF NOT EXISTS xq4 (id int,num int,dq String,rksj STRING)  ROW FORMAT DELIMITED FIELDS TERMINATED BY ',' LINES TERMINATED BY '\n' STORED AS TEXTFILE

复制表结构

该方式不能复制分区

create table xq4 as select * from xq3;

--推荐

create table xq4 like xq3;

复制数据

insert overwrite xq4 select * from xq3;

© 本文著作权归作者所有，转载前请务必署名

最新文章

已安装docker的情况下单独安装docker compose

安装命令curl -L "https://github.com/docker/compose/releases/download/v2.20.0/docker-compose-$(uname -s)-$(uname -m)" -o /usr/local/bin/docker-co

mysql查看和修改时区

1.查看时区-- 查看全局时区SHOW GLOBAL VARIABLES LIKE '%time_zone%';-- 查看当前会话时区SHOW SESSION VARIABLES LIKE '%time_zone%';-- 查看当前时间和UTC时间SELECT NOW

幻兽帕鲁服务器命令

获取管理员权限：/AdminPassword [管理员密码]显示当前玩家/ShowPlayers踢出/KickPlayer [UserID]/[SteamID64]封禁/BanPlayer [UserID]/[SteamID64]传送（传送到目标玩家身边）/TeleportToPlayer {Ste

系统开启跨架构，导致apt update失败

1.问题描述今天要在树莓派里安装git，树莓派是ubuntu系统，执行apt install git，报错显示404，某些文件找不到。到网站上看了一下，发现实际存在更新版本的文件，请求的是旧版本。于是apt update更新软件包列表，出现以下报错。E: 无法下载 http://ports.ubun

fsck修复磁盘文件系统

问题场景今天碰到了一个问题，磁盘下的一个文件无法删除，出现以下提示：rm: 无法删除 'xxx.flv': 错误的消息ls -l查看权限，除了显示无法访问外，权限显示全是问号。ls: 无法访问 'xxx.flv': 错误的消息总用量 0-????????? ? ? ?

分类

技术分享技术分享

软件问题软件问题

幻兽帕鲁幻兽帕鲁

流媒体流媒体

AI技术 ai技术

elasticsearch elasticsearch

activemq activemq

prometheus prometheus

mariadb mariadb

树莓派树莓派

文件系统文件系统

数据库数据库

标签

幻兽帕鲁幻兽帕鲁

系统架构系统架构

磁盘修复磁盘修复

文件系统文件系统

docker compose dockercompose

deepseek deepseek

流媒体流媒体

网络配置网络配置

gphoto2 gphoto2

chatgpt chatgpt

虚拟内存虚拟内存

用户认证用户认证

mosquitto mosquitto

全局异常处理全局异常处理

线程安全线程安全

文件上传文件上传

springmvc springmvc

javaweb javaweb

服务器服务器

opentsdb opentsdb

时序数据库时序数据库

greenplum greenplum

springboot springboot

x-frame-options x-frame-options

netstat netstat

齐治科技齐治科技

更换源更换源

raspbian raspbian

树莓派树莓派

firewalld firewalld

zookeeper zookeeper

kubernetes kubernetes

磁盘挂载磁盘挂载

mysqldump mysqldump

tortoiseGit tortoisegit

activemq activemq

oracle instant client oracleinstantclient

钢琴曲钢琴曲

用户操作用户操作

prometheus prometheus

ik分词器 ik分词器

JavaScript javascript

head插件 head插件

安装部署安装部署

elasticsearch elasticsearch

科学上网科学上网

远程调试远程调试

容器库容器库

环境安装环境安装

windows windows

问题定位问题定位

混沌工具混沌工具

网络监控网络监控

tcpdump tcpdump

自动清理自动清理

binlog日志 binlog日志

帕尼尼帕尼尼

肯德基肯德基

数据库数据库

mariadb mariadb