怎么看youtube详细统计数据(youtube数据都在哪里查)
youtube测速怎么看
在app里请点击设置,请点击右上角头像→设置→一般→启用统计资料。.然后点开一个视频,点击右上角三个点,选择"专业统计资料"即可查看
(使用浏览器扫码进入在线客服窗口)
复制联系方式
YouTube是一个视频网站,早期公司位于加利福尼亚州的圣布鲁诺。注册于2005年2月15日,由美国华裔陈士骏等人创立,让用户下载、观看及分享影片或短片。
YouTube采用SORENSONSPARK与ADOBEFLASH9提供之影像编码技术,将用户上传影像档案进行压缩转档。YouTube影片内容包罗万象,涵盖个人影片及电视节目片段,音乐录像带及家居录影等。
油管踩赞比怎么看
油管踩赞比在数据中心查看。根据查询相关资料信息,用户需要查看某个作品的踩赞比在数据中心查看即可,踩赞比以百分比数字显示。油管为YouTube,是一个视频网站,早期公司位于美国加利福尼亚州的圣布鲁诺。注册于2005年2月15日,由美国华裔陈士骏等人创立,让用户下载、观看及分享影片或短片。
油管点赞过的视频在哪里
在播放列表中。油管(YouTube)是一个视频网站,早期公司位于加利福尼亚州的圣布鲁诺。
1、首先,进入油管app,登录账号,点击右上角的头像。
2、其次,点击“您在YouTube中的数据”。
3、最后,在播放列表中,即可找到在油管中点赞过的视频。
油管用户数据如何记录
油管用户数据记录方法:
1、记录每条视频的浏览数量。
2、记录多条视频的共同浏览者。
3、记录浏览者的年龄,并将年龄进行分类,理清主要观众的年龄段。
youtube视频数据分析维度不包括什么
发布时间。
查询资料可知,youtube视频数据分析维度是收入、观看时间、互动。不包括发布时间。
YouTube后台给我们提供了强大的数据分析工具,通过advancedmode的自定义模式我们可以筛选数据,在分析YouTube视频数据时,你需要清楚自己的目标是什么。
Hive实战之Youtube数据集
本次实战的数据来自于"YouTube视频统计与社交网络"的数据集,是西蒙弗雷泽大学计算机学院在2008年所爬取的数据
数据集地址
数据之间采用"\t"作为分隔符
具体数据如下:
数据量大小为1G,条数为500万+
使用环境为
hive-1.1.0-cdh5.4.5
hadoop-2.6.0-cdh5.4.5
演示形式为使用hive shell
我们一起来看看数据
主要的问题在于category和relatedIDs处理,由于Hive是支持array格式的,所以我们想到的是使用array来存储category和relatedIDs,但是我们发现category的分割符是""而realatedIDs的分隔符是"\t",我们在创建表格的时候能够指定array的分隔符,但是只能指定一个,所以再将数据导入到Hive表格之前我们需要对数据进行一定转换和清洗
并且数据中肯定会存在一些不完整数据和一些奇怪的格式,所以数据的清洗是必要的,我在这里所使用的数据清洗方式是使用Spark进行清洗,也可以使用自定义UDF函数来进行清洗
数据清洗注意点
1)我们可以看到每行数据以"\t"作为分隔符,每行有十列数据,最后一列关联ID可以为空,那么我们对数据进行split之后数组的大小要大于8
2)数据中存在 "uNiKXDA8eyQ KRQE 1035 News amp; Politics 107" 这样格式的数据,所以在处理category时需要注意 News Politics中间的 amp;
处理后的数据如下:
下面的实战都是基于数据清洗后的数据进行的
1)youtube1的创建,文件格式为textfile
create table youtube1(videoId string, uploader string, age int, category arraystring, length int, views int, rate float, ratings int, comments int,relatedId arraystring)
row format delimited
fields terminated by "\t"
collection items terminated by ""
stored as textfile;
2)youtube2的创建,文件格式为orc
create table youtube2(videoId string, uploader string, age int, category arraystring, length int, views int, rate float, ratings int, comments int,relatedId arraystring)
row format delimited
fields terminated by "\t"
collection items terminated by ""
stored as orc;
3)youtube3的创建,文件格式为orc,进行桶分区
create table youtube3(videoId string, uploader string, age int, category arraystring, length int, views int, rate float, ratings int, comments int,relatedId arraystring)
clustered by (uploader) into 8 buckets
row format delimited
fields terminated by "\t"
collection items terminated by ""
stored as orc;
数据导入:
1)load data inpath "path" into table youtube1;
2)由于无法将textfile格式的数据导入到orc格式的表格,所以数据需要从youtube1导入到youtube2和youtube3:
insert into table youtube2 select * from youtube1;
insert into table youtube3 select * from youtube1;
1)user_tmp的创建,文件格式textfile,24buckets
create table user_tmp(uploader string,videos int,friends int)
clustered by (uploader) into 24 buckets
row format delimited
fields terminated by "\t"
stored as textfile;
2)user的创建,文件格式orc,24buckets
create table user(uploader string,videos int,friends int)
clustered by (uploader) into 24 buckets
row format delimited
fields terminated by "\t"
stored as orc;
user表的数据导入也是同理
数据导入:
1)load data inpath "path" into table user_tmp;
2)由于无法将textfile格式的数据导入到orc格式的表格,所以数据需要从user_tmp导入到user:
insert into table user select * from user_tmp;
1)统计出观看数最多的10个视频
2)统计出视频类别热度的前10个类型
3)统计出视频观看数最高的50个视频的所属类别
4)统计出观看数最多的前N个视频所关联的视频的所属类别排行
5)筛选出每个类别中热度最高的前10个视频
6)筛选出每个类别中评分最高的前10个视频
7)找出用户中上传视频最多的10个用户的所有视频
8)筛选出每个类别中观看数Top10
select * from youtube3 order by views desc limit 10;
结果如下:
select tagId, count(a.videoid) as sum from (select videoid,tagId from youtube3 lateral view explode(category) catetory as tagId) a group by a.tagId order by sum desc limit 10;
结果:
select tagId, count(a.videoid) as sum from (select videoid,tagId from (select * from youtube3 order by views desc limit 20) e lateral view explode(category) catetory as tagId) a group by a.tagId order by sum desc;
结果:
思路:
结果:
思路:
结果如下:
select * from youtube_category where categoryId="Music" order by ratings desc limit 10;
结果如下:
思路:
结果如下: