是不是快下班了?工作结尾了吗?
订阅RSS:

任霏博客

Hadoop入门教程(二):Hadoop 的安装教程

在开始我们的 Hadoop 之旅前,我们需要先学会安装 Hadoop ,在后面我们将使用多个 Hadoop 节点进行试验和学习,本文将带你安装 Hadoop,这是非常简单的。

进入阅读
Parallels Desktop 网络初始化失败 USB 不能连接设备

Parallels Desktop 在 macOS Big Sur 系统上无法联网,并且无法连接USB设备。会提示网络初始化失败、USB无法连接到虚拟机的情况,今天分享一下解决方案。

进入阅读
HTTPS(SSL) 网站 使用 discuz-ucenter-api-for-java 的更新

随着互联网的发展越来越多的网站使用 https 加密连接来访问,其中 Discuz 的 UCenter 与 Java 交互的 discuz-ucenter-api-for-java 在使用 https 时却会出现问题,因为这个项目是十分古老的项目很久没有更新了,并不支持 https 的接口,所以我进行了更新。

进入阅读
使用 DBeaver 连接 达梦(DaMeng) 数据库 的教程

在新版的 DBeaver 中似乎不再支持 ODBC 连接,可能是因为 JDBC-ODBC 网桥已经从 Java 8 中移除。所以网络上的旧教程让使用 ODBC 连接就找不到了,现在给大家一个正确使用 DBeaver 连接 达梦(DaMeng) 数据库 的教程。

进入阅读
关于更正《大数据ETL技术中的数据抽取方法》

原文中第一次对比求出了 CuB 和 CuA 两个补集,第二次拉取真实数据进行二次比对,根据在实际生产环境汇总应用时发现,在第二次比对中拉取原文数据是可以省略的,所以更正了上一篇文章的ETL操作步奏。

进入阅读
数据库 MariaDB/MySQL 忽略大小写敏感设置(Linux下的Ubuntu环境)

数据库 MariaDB/MySQL 在 Linux 环境下会大小写敏感,这个时候表名字段名和写的SQL中大小写对不上就会报错,所以我们会先关闭大小写敏感。

进入阅读
Hadoop入门教程(一):Hadoop 是什么 Hadoop 由什么组成

在上一大章节我们讲了大数据仓库的概念,我们了解了数仓的建设思想,接下来我们就开始让我们的思想慢慢变为现实,承载这一切的基础就是 Hadoop 生态圈中的各种大数据组件,慢慢形成我们的大数据仓库和平台。

进入阅读
SQL 语句中 Like 模糊查询基本语法介绍

在 SQL 语句中,LIKE 操作符用于在 WHERE 子句中搜索列中的指定模式。在实际使用中也是非常常见的查询方式,很多同学经常使用 % 百分号来进行模糊搜索,但其实还支持很多种查询模式。

进入阅读
大数据ETL技术中对数据进行局部哈希对比优化对比速度

在上一篇文章中我们通过对每条数据的所有字段进行了哈希摘要,将几十个字段摘要成了一串哈希值,加快的我们的对比速度,但这只是将字段进行了压缩,数据的数量还是没有被压缩,如果有几十亿条数据,我们还是不能快速的找到变化的数据。

进入阅读
数据仓库的概念(四):全量表、增量表、拉链表、流水表、快照表

上一篇文章我们了解了事实表、维度表和星型模型、雪花模型,除了这些在行业中还有一些专业名词需要了解,本篇文章将带你了解大数据行业“黑话”全量表、增量表、拉链表、流水表、快照表都是什么。可能下面的一些内容理解不了,等到搞 hive 的时候就知道了,先了解一下基本的知识。

进入阅读
Linux、Unix、MacOS 存在 sudo 漏洞(CVE-2021-3156) 利用复现

这是 Sudo 工具中存在十年之久的漏洞,可能会授予任意本地用户对基于 Unix 的系统(包括 macOS Big Sur 和早期版本)进行根访问。可通过非法操作为任意本地用户授予 root 权限。用户要触发它,只需要重写 argv[0]或者创建一个符号链接。

进入阅读
微信搜一搜:任霏博客