V2EX = way to explore
V2EX 是一个关于分享和探索的地方
Sign Up Now
For Existing Member  Sign In
MySQL 5.5 Community Server
MySQL 5.6 Community Server
Percona Configuration Wizard
XtraBackup 搭建主从复制
Great Sites on MySQL
Percona
MySQL Performance Blog
Severalnines
推荐管理工具
Sequel Pro
phpMyAdmin
推荐书目
MySQL Cookbook
MySQL 相关项目
MariaDB
Drizzle
参考文档
http://mysql-python.sourceforge.net/MySQLdb.html
llx126753
V2EX  ›  MySQL

如何将数据库中的数据只保留 3 天左右

  •  
  •   llx126753 · Dec 27, 2016 · 5842 views
    This topic created in 3408 days ago, the information mentioned may be changed or developed.
    数据库现在保留了 7 天的数据,大小差不多 180g 左右,做了计划任务,每天将数据进行清理, delete from log where create_time < from_unixtime(unix_timestamp(now())-6*24*3600,'%Y-%m-%d') limit 100000; 像这样子删除数据,数据占用空间还是没有减少。。百度说是因为这样子删除会有碎片什么的,,求大神提供一个更好地方案
    19 replies    2017-02-22 09:47:32 +08:00
    llx126753
        1
    llx126753  
    OP
       Dec 27, 2016
    每天的数据量比较大,这个没法集中处理数据
    xiaohanqing
        2
    xiaohanqing  
       Dec 27, 2016 via Android
    表引擎
    j717273419
        3
    j717273419  
       Dec 27, 2016
    那能不能在清理之后,调用碎片整理?
    i4oolish
        4
    i4oolish  
       Dec 27, 2016
    什么数据库, 什么存储引擎
    R18
        5
    R18  
       Dec 27, 2016 via Android
    分表?我们系统跑了两个月 200 多 G 数据 我给按天放的,就是为了以后删除方便
    fds
        6
    fds  
       Dec 27, 2016
    别存数据库了,每天建个目录,以文件形式存储。既然可以随便删,想必也不需要数据库那么高的安全性。
    mm163
        7
    mm163  
       Dec 27, 2016
    新记录不要每次都 INSERT :创建新记录前先取一条 3 天前 create_time 值最小的记录,把该记录 UPDATE 成新记录(如果没有取到 3 天前的记录,则 INSERT )。
    ty89
        8
    ty89  
       Dec 27, 2016
    看到百度说三个字我就懒得正儿八经回复了
    est
        9
    est  
       Dec 27, 2016
    没 commit ?
    isolation level 是啥?
    simple2025
        10
    simple2025  
       Dec 27, 2016
    关注。等大神回复
    em70
        11
    em70  
       Dec 27, 2016
    每天建个表嘛
    akira
        12
    akira  
       Dec 27, 2016
    msg7086
        13
    msg7086  
       Dec 28, 2016
    然而你重新写入的时候空间占用也不会变大啊。
    删除不释放不是很正常么,要是一直释放,那硬盘不被你跑死啊。
    Livid
        14
    Livid  
    MOD
    PRO
       Dec 28, 2016
    1. 确保开启了 InnoDB 的 file per table ,这样每个表是一个单独的文件,不会出现一个几百 G 甚至上 T 的巨大文件:

    https://dev.mysql.com/doc/refman/5.6/en/innodb-multiple-tablespaces.html

    2. 这种类型的数据可以按天建表,这样如果需要删除的话,直接 DROP TABLE 即可。
    ragnaroks
        15
    ragnaroks  
       Dec 28, 2016
    按天分表+1,做个自动备份+删除脚本
    simple2025
        16
    simple2025  
       Dec 28, 2016
    @ragnaroks 能问下代码怎们办?总不可能每天改一次 python ORM 吧
    ragnaroks
        17
    ragnaroks  
       Dec 28, 2016
    @chenqh 我是直接用 shell 写的,按文件最后写入时间(修改时间)来,然后计划任务
    realpg
        18
    realpg  
    PRO
       Dec 29, 2016
    你的数据库是什么类型的系统数据?
    是否是直接网站的数据?
    如果是直接网站的数据(比如一个 PHP 网站),可以这样

    所有网页请求包含一个 gc.php
    内容是连上数据库执行一个查询
    delete from `XXXX` where expiredtime< 现在时间 limit 5;
    来一次有效访问帮你删除 5 条过期数据
    PV 大的话很快就帮你分散的删干净了,对整体影响不大
    具体 limit 的数值根据访问量和数据量动态调优

    也可根据逻辑不同,只在静态渲染类的操作上 include 这个 gc.php
    访问量太大的话,可以先判断一个随机数是否小于 20 执行这个之类
    lytofb
        19
    lytofb  
       Feb 22, 2017
    一天建一个表,过 7 天删除
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   3006 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 77ms · UTC 15:13 · PVG 23:13 · LAX 08:13 · JFK 11:13
    ♥ Do have faith in what you're doing.