Make dist worker work with pipelining

2025-12-18 11:06:48 -05:00 · 2012-07-04 23:54:22 -07:00
parent a866d058fe
commit bb852ff255
2 changed files with 59 additions and 24 deletions
--- a/dist/worker.py
+++ b/dist/worker.py
@ -2,7 +2,9 @@
 import sys
 from cStringIO import StringIO

-import zmq
+import gevent
+from gevent import spawn, queue
+import zmq.green as zmq
 import pycuda.driver as cuda
 cuda.init()

@ -19,31 +21,46 @@ class PrecompiledRenderer(render.Renderer):
        self.packer, self.cubin = packer, cubin
        super(PrecompiledRenderer, self).__init__(gnm, gprof)

-def main(card_num, worker_addr):
-    dev = cuda.Device(card_num)
-    ctx = dev.make_context(cuda.ctx_flags.SCHED_BLOCKING_SYNC)
+def main(worker_addr):
    rmgr = render.RenderManager()

    ctx = zmq.Context()
-    sock = ctx.socket(zmq.REQ)
-    sock.connect(worker_addr)
+    in_queue = queue.Queue(0)
+    out_queue = queue.Queue(0)

-    # Start the request loop with an empty job
-    sock.send('')
-    hash = None
-    while True:
-        addr, task, cubin, packer = sock.recv_pyobj()
-        gprof = profile.wrap(task.profile, task.anim)
-        if hash != task.hash:
-            rdr = PrecompiledRenderer(task.anim, gprof, packer, cubin)
-        buf = rmgr.queue_frame(rdr, task.anim, gprof, task.time)
-        ofile = StringIO()
-        output.PILOutput.save(buf, ofile, task.id[-3:])
-        ofile.seek(0)
-        sock.send_multipart(addr + [ofile.read()])
-        hash = task.hash
-        print 'Rendered', task.id
+    def request_loop():
+        sock = ctx.socket(zmq.REQ)
+        sock.connect(worker_addr)
+
+        # Start the request loop with an empty job
+        sock.send('')
+
+        hash = None
+        while True:
+            addr, task, cubin, packer = sock.recv_pyobj()
+            gprof = profile.wrap(task.profile, task.anim)
+            if hash != task.hash:
+                rdr = PrecompiledRenderer(task.anim, gprof, packer, cubin)
+            evt, buf = rmgr.queue_frame(rdr, task.anim, gprof, task.time)
+            while not evt.query():
+                gevent.sleep(0.01)
+            ofile = StringIO()
+            output.PILOutput.save(buf, ofile, task.id[-3:])
+            ofile.seek(0)
+            sock.send_multipart(addr + [ofile.read()])
+            hash = task.hash
+
+            print 'Rendered', task.id, 'in', int(evt.time()), 'ms'
+
+    # Spawn two request loops to take advantage of CUDA pipelining.
+    spawn(request_loop)
+    request_loop()

 if __name__ == "__main__":
    import addrs
-    main(int(sys.argv[1]), addrs.addrs['workers'])
+    dev = cuda.Device(int(sys.argv[1]))
+    cuctx = dev.make_context(cuda.ctx_flags.SCHED_BLOCKING_SYNC)
+    try:
+        main(addrs.addrs['workers'])
+    finally:
+        cuda.Context.pop()