找回密码
 立即注册

QQ登录

只需一步,快速开始

autoegg

高级会员

107

主题

316

帖子

1047

积分

高级会员

积分
1047

微信认证勋章

autoegg
高级会员   /  发表于:2022-1-13 19:53  /   查看:2165  /  回复:4
10金币
本帖最后由 autoegg 于 2022-1-13 19:56 编辑

原始数据是这样的:1、总共有600多个字段
2、每个单元格同时包含了字段名称和对应的数值
3、每行为1个时间点的数据,每行可能有几十到几百个字段和值不等,长短不一,没有规律
4、每列并不一定都是同样字段名称的内容,比较混乱




有没有方案用活字格对数据做快速处理,得到如下形式?1、600多个字段各占1列
2、保持每行为时间点不变,将对应的字段的值填到相应的列中,没有值的空着


附件: 您需要 登录 才可以下载或查看,没有帐号?立即注册

最佳答案

查看完整内容

您好,这个建议您使用Excel或者Python来处理数据,咱们活字格主要还是实现业务逻辑的功能嘛,如果是这种专门的数据处理,还是推荐您使用专门处理数据的利器比较好,毕竟术业有专攻。 用简单的数据模拟一下: 我们用python处理一下这个数据,代码: 处理结果: 注意哦:代码中取的是excel文件的绝对路径。

4 个回复

倒序浏览
最佳答案
最佳答案
Howie.Sun讲师达人认证 悬赏达人认证 活字格认证
论坛元老   /  发表于:2022-1-13 19:53:43
来自 5#
本帖最后由 Howie.Sun 于 2022-1-27 22:27 编辑

您好,这个建议您使用Excel或者Python来处理数据,咱们活字格主要还是实现业务逻辑的功能嘛,如果是这种专门的数据处理,还是推荐您使用专门处理数据的利器比较好,毕竟术业有专攻
用简单的数据模拟一下:

我们用python处理一下这个数据,代码:
  1. # -*- coding:utf-8 -*-
  2. # @Author: Sun Hao
  3. # @Description:
  4. # @File : 03excel.py
  5. import pandas as pd

  6. data_dir = r'C:\Users\sh921\Desktop\测试.xlsx'
  7. to_data_dir = r'C:\Users\sh921\Desktop\测试1.xlsx'
  8. df = pd.read_excel(data_dir, sheet_name='Sheet1', header=None)
  9. col_names = []
  10. rows_list = []
  11. for i in range(len(df)):
  12.     rows = []
  13.     for j, rowi in enumerate(df.loc[i].values):
  14.         if j == 0:
  15.             rows.append(rowi)
  16.             if i == 0:
  17.                 col_names.append("")
  18.         else:
  19.             print(rowi)
  20.             [name, value] = str(rowi).split(':')
  21.             if i == 0:
  22.                 col_names.append(name)
  23.             rows.append(value)
  24.     rows_list.append(rows)
  25. # print(rows_list)
  26. # print(col_names)
  27. dt = pd.DataFrame(rows_list, columns=col_names)
  28. dt.to_excel(to_data_dir, index=0)
复制代码
处理结果:

注意哦:代码中取的是excel文件的绝对路径。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
回复 使用道具 举报
guoqp
银牌会员   /  发表于:2022-1-13 21:51:35
2#
从你的需求上来看EXCEL比活字格处理更方便
每列字段名可以直接用公式取,还可以完成替换。
回复 使用道具 举报
VVANVI悬赏达人认证
论坛元老   /  发表于:2022-1-13 22:17:41
3#
用pandas 处理比较合适
回复 使用道具 举报
amtath悬赏达人认证 活字格认证
论坛元老   /  发表于:2022-1-13 23:17:28
4#
光光选字段就要累死。
回复 使用道具 举报
您需要登录后才可以回帖 登录 | 立即注册
返回顶部