We were researching about this problem for some days now. We also met with Richie yesterday and he explained us a bit what we were seeing. If we are right, the problem is that the interpreter is not fully reentrant, so for callbacks mechanism to work you have to first set the interpreter in a state that it waits the callback to come in. That way, when the callback arrives, the interpreter is ready to handle it, and when it finishes handling, the state is correctly restored. Is that right? <div>

<br></div><div>But in the multithreaded stack VM, you Eliot solved this in other way, right? I think you said that you set the stack as if it was full so that on the next method activation (well here I&#39;m just guessing) or the next heartbeat you detected it and made space for the callback to come. I may have said nonsense sorry if that happened.</div>

<div><br></div><div>The thing is that for our application of paging we need to solve the callback instantly, no matter what the interpreter is doing at the moment. So if I was correct about the StackVM, then we couldn&#39;t use that either. In that case what we&#39;d need for this special type of callbacks is to be able to save all the context of the interpreter. We don&#39;t want to have a perfect solution, just a fine enough one (then we can improve it after moving to cog, but we must finish this step first, one at a time). Could you tell us which variables of the interpreter must be saved and which mustn&#39;t?<br>

<br></div><div>Maybe Igor you had some experience about this with hydravm, right? Also, how do the nativeboost callbacks work, they might be just what we are looking for.</div><div><br></div><div>Regards,</div><div>          Javier.</div>

<div><br><div class="gmail_quote">On Thu, Mar 31, 2011 at 2:27 PM, Javier Pimás <span dir="ltr">&lt;<a href="mailto:elpochodelagente@gmail.com">elpochodelagente@gmail.com</a>&gt;</span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex;">

hi! the callback is comming just in:<div><br></div><div><div>&quot;Clean up session id and external primitive index&quot;</div><div><span style="white-space:pre-wrap">        </span>self storePointerUnchecked: 2 ofObject: lit withValue: ConstZero. &lt;- here</div>


<div><span style="white-space:pre-wrap">        </span>self storePointerUnchecked: 3 ofObject: lit withValue: ConstZero.</div><div><br></div><div>I know, because I&#39;m debugging with gdb, that writing to that place causes a page fault (target object&#39;s page is marked as read only), and the page fault handling mecanism issues the callback to handle it). After all that, the original primExternalCall continues execution, and uses the wrong values of messageSelector, and lkupClass (even if it found the primitive it would write in the wrong place of the cache I think).</div>


<div><br></div><div>I know that the vm has a lot of state and of course you don&#39;t want to save everything, but the callback could come in any place, not just primExternalCall, so any variable could be used. I was actually surprised that just saving the active context and creating a new one was enough to save all the state of the VM. Thinking what is enough will not be easy. I tried manually saving and then restoring messageSelector and lkupClass before and after the callback, which solved the problem for some iterations of interpreting, but seemed to corrupt the image, which crashed after some moments. Is there anything else you&#39;d recommend to save to workaround this for now?</div>

<div><div></div><div class="h5">
<div><br></div><br><div class="gmail_quote">On Thu, Mar 31, 2011 at 12:53 PM, Eliot Miranda <span dir="ltr">&lt;<a href="mailto:eliot.miranda@gmail.com" target="_blank">eliot.miranda@gmail.com</a>&gt;</span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">


<br><br><div class="gmail_quote"><div>On Thu, Mar 31, 2011 at 6:11 AM, Javier Pimás <span dir="ltr">&lt;<a href="mailto:elpochodelagente@gmail.com" target="_blank">elpochodelagente@gmail.com</a>&gt;</span> wrote:<br>
</div><div><div></div><div><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
Hi, we are having a problem with callbacks in alien and we would like to see if we are doing something wrong or if it is a bug in the implementation (for the standard old vm).<div><br></div><div>We are receiving the callback just in the middle of a primitiveExternalCall (actually to a function that will fail because the plugin is not present, but i don&#39;t think that&#39;s important). We pinned it to occur always in the same line, which is </div>





<div><br></div><div><div><span style="white-space:pre-wrap">        </span>longAtput((lit + (BASE_HEADER_SIZE)) + (2 &lt;&lt; (SHIFT_FOR_WORD)), ConstZero);</div></div><div><br></div><div>of primitiveExternalCall. When the callback occurs, the thunkEntry is called, which if we understand correctly, saves the active context and runs the interpreter by calling sendInvokeCallbackStackRegistersJmpbuf. The problem is that things like messageSelector and lkupClass, which are global variables are not saved while saving the context, and when the callback returns, the last line of primitiveExternalCall,</div>





<div><br></div><div><div><span style="white-space:pre-wrap">                </span>rewriteMethodCacheSelclassprimIndex(messageSelector, lkupClass, 0);</div>

</div><div><br></div><div>puts a 0 in the wrong place. Also, probably as las message sent was primReturnFromContext:through: (because we just returned from the context), we get a primitiveFailed, but not for the original called function but for primReturnFromContext:through:.</div>





<div><br></div><div>What do you think? are we missing something?</div></blockquote><div><br></div></div></div><div>Hmmm, looking at it I think you must be taking a callback before the external call occurs.  Here&#39;s how the code reads in Cog:</div>



<div><br></div><div><br></div><div><span style="white-space:pre-wrap">        </span>...</div><div><br></div><div><span style="white-space:pre-wrap">        </span>addr := self ioLoadExternalFunction: functionName + BaseHeaderSize</div>



<div><span style="white-space:pre-wrap">                                </span>OfLength: functionLength</div><div><span style="white-space:pre-wrap">                                </span>FromModule: moduleName + BaseHeaderSize</div><div><span style="white-space:pre-wrap">                                </span>OfLength: moduleLength.</div>



<div><span style="white-space:pre-wrap">        </span>addr = 0</div><div><span style="white-space:pre-wrap">                </span>ifTrue: [index := -1]</div><div><span style="white-space:pre-wrap">                </span>ifFalse: [&quot;add the function to the external primitive table&quot;</div>



<div><span style="white-space:pre-wrap">                        </span>index := self addToExternalPrimitiveTable: addr].</div><div><br></div><div><span style="white-space:pre-wrap">        </span>&quot;Store the index (or -1 if failure) back in the literal&quot;</div>



<div><span style="white-space:pre-wrap">        </span>objectMemory storePointerUnchecked: 3 ofObject: lit withValue: (objectMemory integerObjectOf: index).</div><div><br></div><div><span style="white-space:pre-wrap">        </span>&quot;If the function has been successfully loaded cache and call it&quot;</div>



<div><span style="white-space:pre-wrap">        </span>index &gt;= 0</div><div><span style="white-space:pre-wrap">                </span>ifTrue:</div><div><span style="white-space:pre-wrap">                        </span>[self rewriteMethodCacheEntryForExternalPrimitiveToFunction: (self cCode: [addr] inSmalltalk: [1000 + index]).</div>



<div><span style="white-space:pre-wrap">                        </span>self callExternalPrimitive: addr]</div><div><span style="white-space:pre-wrap">                </span>ifFalse: [&quot;Otherwise void the primitive function and fail&quot;</div>
<div><span style="white-space:pre-wrap">                        </span>self rewriteMethodCacheEntryForExternalPrimitiveToFunction: 0.</div><div><span style="white-space:pre-wrap">                        </span>^self primitiveFailFor: PrimErrNotFound]</div>
<div><br></div><div>So the rewrite to zero (self rewriteMethodCacheEntryForExternalPrimitiveToFunction: 0) isn&#39;t done if no callout is made.  Where is your callback comming from?  Looks like its comming from the internals of things like ioLoadExternalFunction...</div>



<div><br></div><div>It is hard to save and restore all the VM state around a callback.  There&#39;s too much of it in the current VM design.  Take a look at rewriteMethodCacheEntryForExternalPrimitiveToFunction:.  It is written to be fast, using lastMethodCacheProbeWrite to avoid work in rewriting the cache entry if the module and/or function load fails.  That&#39;s state one doesn&#39;t want to have to save and restore around callbacks along with lkupClass, messageSelector.  primitiveFunctionPointer, newMethod, framePointer, instructionPointer and stackPointer are already a lot.  Tthis needs more thought.</div>


<div>
<div><br></div><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div><br></div><div>Regards,</div><div>            Javier.</div><div><br></div><font color="#888888"><div>



<br></div><div><div>-- <br>Javier Pimás<br>Ciudad de Buenos Aires<br>


</div></div>
</font></blockquote></div></div><br>
</blockquote></div><br><br clear="all"><br>-- <br>Javier Pimás<br>Ciudad de Buenos Aires<br>
</div></div></div>
</blockquote></div><br><br clear="all"><br>-- <br>Javier Pimás<br>Ciudad de Buenos Aires<br>
</div>