仓库源文站点原文


title: 百万数据如何在前端快速流畅显示? categories:


如果要在前端呈现大量的数据,一般的策略就是分页。前端要呈现百万数据,这个需求是很少见的,但是展示千条稍微复杂点的数据,这种需求还是比较常见,只要内存够,javascript 肯定是吃得消的,计算几千上万条数据,js 效率根本不在话下,但是 DOM 的渲染浏览器扛不住,CPU 稍微搓点的电脑必然会卡爆。

本文的策略是,显示三屏数据,其他的移除 DOM。

一、 策略

下面是我简单勾画的一个草图,我们把一串数据放到一个容器当中,这串数据的高度(Data List)肯定是比 Container 的高度要高很多的,如果我们一次性把数据都显示出来,浏览器需要花费大量的时间来计算每个 data 的位置,并且依次渲染出来,整个过程中 JS 并没有花费太多的时间,开销主要是 DOM 渲染。

                          /==============> Data List
        |     ....     | /
        +--------------+/
+=======|=====data=====|========+
|       +--------------+        |
|       |     data     |        |
|       +--------------+        |\
|       |     data     |        | \
|       +--------------+        |  \======> Container
+=======|=====data=====|========+
        +--------------+
        |     ....     |        Created By Barret Lee

为了解决这个问题,我们让数据是显示一部分,这一部分是 Container 可视区域的内容,以及上下各一屏(一屏指的是 Container 高度所能容纳的区域大小)的缓存内容。如果 Container 比较高,也可是只缓存半屏,缓存的原因是,在我们滚动滚动条的时候,js 需要时间来拼凑字符串(或者创建 Node ),这个时候浏览器还来不及渲染,所以会出现临时的空白,这种体验是相当不好的。

二、Demo

demo 在 IE 7、8 有 bug,请读者自己修复吧~

代码:

<title>百万数据前端快速流畅显示</title>
<style type="text/css">
#box {position: relative; height: 300px; width: 200px; border:1px solid #CCC; overflow: auto}
#box div { position: absolute; height: 20px; width: 100%; left: 0; overflow: hidden; font: 16px/20px Courier;}
</style>

<div id="box"></div>

<script type="text/javascript">
var total = 1e5
  , len = total
  , height = 300
  , delta = 20
  , num = height / delta
  , data = [];

for(var i = 0; i < total; i++){
  data.push({content: "item-" + i});
}

var box = document.getElementById("box");
box.onscroll = function(){
  var sTop = box.scrollTop||0
    , first = parseInt(sTop / delta, 10)
    , start = Math.max(first - num, 0)
    , end = Math.min(first + num, len - 1)
    , i = 0;

  for(var s = start; s <= end; s++){
    var child = box.children[s];
    if(!box.contains(child) && s != len - 1){
      insert(s);
    }
  }

  while(child = box.children[i++]){
    var index = child.getAttribute("data-index");
    if((index > end || index < start) && index != len - 1){
      box.removeChild(child);
    }
  }

};

function insert(i){
  var div = document.createElement("div");
  div.setAttribute("data-index", i);
  div.style.top = delta * i + "px";
  div.appendChild(document.createTextNode(data[i].content));
  box.appendChild(div);
}

box.onscroll();
insert(len - 1);
</script>

可以戳这个 demo,或者看这里 http://gist.github.com/barretlee/9744160

三、算法说明

1. 计算 start 和 end 节点

        |              |
+=======|==============|========+——
|    ↓——+--------------+        | ↑
| delta |              |        |
|    ↑——+--------------+        | height
|       |              |        |
|       +--------------+        | ↓
+=======|==============|========+——
        |              |

Container 可以容纳的 Data 数目为 num = height / delta,Container 顶部第一个节点的索引值为

 var first = parseInt(Container.scrollTop / delta);

由于我们上下都有留出一屏,所以

var start = Math.max(first - num, 0);
var end = Math.min(first + num, len - 1);

2. 插入节点

通过上面的计算,从 start 到 end 将节点一次插入到 Container 中,并且将最后一个节点插入到 DOM 中。

// 插入最后一个节点
insert(len - 1);
// 插入从 start 到 end 之间的节点
for(var s = start; s <= end; s++){
  var child = Container.children[s];
  // 如果 Container 中已经有该节点,或者该节点为最后一个节点则跳过
  if(!Container.contains(child) && s != len - 1){
    insert(s);
  }
}

这里解释下为什么要插入最后一个节点,插入节点的方式是:

function insert(i){
  var div = document.createElement("div");
  div.setAttribute("data-index", i);
  div.style.top = delta * i + "px";
  div.appendChild(document.createTextNode(data[i].content));
  Container.appendChild(div);
}

可以看到我们给插入的节点都加了一个 top 属性,最后一个节点的 top 是最大的,只有把这个节点插入到 DOM 中,才能让滚动条拉长,让人感觉放了很多的数据。

3. 删除节点

为了减少浏览器的重排(reflow),我们可以隐藏三屏之外的数据。我这里为了方便,直接给删除掉了,后续需要再重新插入。

while(child = Container.children[i++]){
  var index = child.getAttribute("data-index");
  // 这里记得不要把最后一个节点给删除掉了
  if((index > end || index < start) && index != len - 1){
    Container.removeChild(child);
  }
}

当 DOM 加载完毕之后,触发一次 Container.onscroll(),然后整个程序就 OK 了。

四、小结

本文主要是叙述大数据加载的一点基本原理,程序可能有 bug,也有很多地方可以优化,了解下算法就行了。